首页香港脉搏理财/管理
港股强化版MQ
方展策

方展策

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

谷歌AI反击战!直接生成答案,将损害全球网站利益?

2023-05-22 16:29
1A+A-

   为抗衡ChatGPT,Google今年2月发表聊天机械人Bard,但普遍被认为比不上前者,以致股价暴跌。事隔3个月,该公司在Google I/O开发者大会上,可以拿出什么石破天惊的新产品来扳回一城,遂成为全球科技界焦点。结果,Google只是平实地端出升级版Bard与新大型语言模型PaLM 2。但外界对此做法却表示赞许,认为Google没有说些不切实际的伟大愿景,而是老老实实地改良产品,并示范AI如何融入旗下各种网上服务,展示有能力持续发展AI的证据,反而让人更有信心。


Google深耕AI多年却未获关注


   回顾历届Google I/O大会,AI一直是重点主题。早在I/O 2017上,执行长皮查伊(Sundar Pichai)已宣告,Google是“以AI为核心的公司”。I/O 2021上,Google发表了对话AI模型LaMDA,宣称其理解对话上下文的能力,远胜当时所有大型语言模型。I/O 2022上,Google宣布LaMDA 2的诞生,表示新模型深度结合AI与机器学习技术,能够就看似无穷无尽的话题,进行自由而流畅的对话。


   即使Google大肆吹嘘LaMDA系列模型有多厉害,但却始终无法引起太大关注。直至OpenAI于2022年11月推出ChatGPT,才真正让生成式AI与大型语言模型红起来。眼看自己深耕多年的领域,突然被一家名不经传的小公司独领风骚,令Google变得无比焦虑,2023年5月10日,终于来到新一届I/O大会。Google在会上提及“AI”接近200次,除升级版Bard外,还一口气发表25项建基于PaLM 2模型上的新功能,几乎把AI整合至Google Search、Google Maps、Google Docs、Gmail等所有服务。由此可见,Google急于向所有人证明,它依然是一家顶尖的AI公司。


Google在I/O 2023大会上发表新一代大型语言模型PaLM 2,比起2022年推出的上一代模型,在多语言处理、推理和编程能力方面有很大提升。(图片来源:翻摄Google官方YouTube影片)


Bard以文字搭图片回答用户提问


   我们先来看看Bard的3大升级功能。首先,Bard能够以图片回答你的提问。假如你询问Bard:“新奥尔良有哪些必去景点?”Bard回复的答案除文字外,也会配上图片,让你可以先看看新奥尔良的风景。


   同时,Google又将Google Lens的视觉分析功能整合到Bard,让它不但可以图片回答,还可以看懂图片。譬如上传狗仔相片,并要求Bard生成有趣的文案,它就会自行理解相片中狗只的品种,然后产出与狗仔相关的文案。


   其次,Bard也针对编程工作上作出优化。当编程人员要求Bard协助编写程序代码,倘若当中引用了一段他人的程序代码,只要点击“标注”,Bard即会把引用部分标记底线,并提供来源连结,方便编程人员查核。Bard又会推出编程人员最喜欢的深色模式,让接口可以变成黑底白字,以减轻眼睛负担。此外,Google跟网上开发平台Replit合作,可以把Bard生成的程序代码汇出到Replit直接执行。


在Bard上输入提示词“What are some must-see sights in New Orleans?”,AI生成有图片辅助的文本答案,方便用户先看看New Orleans的风景。(图片来源:Google官方网志)


将两只狗的相片上传到Bard,只输入提示词“Write a funny caption about these two”,什么也没解释,Bard就自行理解相中狗只的品种,并提供几组相关的图片说明供用户选择。(图片来源:Google官方网志)


Bard融入各项Google网上服务


   其三,Bard将与Google网上服务全面整合。Google为Google Workspace推出一个AI助手机械人“Duet AI”。当你利用Google Slides制作简报时,想为简报加入图片,便可以要求Duet AI帮手生成图片;如你不满意图片效果,可以另行设定图片风格,再要求Duet AI产出新作品。再者,用户请求Bard帮忙草拟电邮和文件后,也可以直接汇出到Gmail和Google Docs,免去“Copy & Paste”的运作,直接替你无缝转移文字内容。


   面对Bing Chat的威胁,Google亦会将AI整合到Google Search,推出新形态的搜寻接口“Snapshot”。当用户输入关键词后,如AI判断这不属于商业性搜索,便会把搜寻到的资料整理成一段文本答案,列在搜寻结果页面的最上方;如判定为具有商业性的搜索,页顶依然会显示搜寻广告。


   如此一来,Google完全颠覆了一直以来提供信息的方式:从以往纯粹提供相关网页链接的清单,变成供应由AI生成的自家内容,但同时又保留了广告版面的曝光机会,此做法备受外界看好。因此,Google母公司Alphabet Inc.的Class A股在I/O大会后持续上涨,及至5月19日收122.76美元,创2022年8月16日以来收盘新高,已将ChatGPT在2022年11月推出后的失土全部收复。


Google与Adobe合作,把后者的AI绘图技术“Firefly”整合至Bard,让用户可以要求Bard生成图片。有了Adobe的支持,图片版权与画质问题都一并解决了。(图片来源:Google官方网志)


用户利用Google Slides制作简报时,如想加入图片,只要在右边侧栏的对话框输入提示词,Duet AI便可以为简报生成图片。(图片来源:Google官方网志)


生成式搜寻或损害内容网站收益


   不过,有人欢笑有人愁。不少网上内容供货商担心,这种生成式搜寻体验(Search Generative Experience)很有可能会影响到旗下网站流量。一旦Google全面推出Snapshot功能,用户可以直接在Google搜寻页面上获得想知的答案,根本无需再点击搜寻结果的网页连结,前往其他网站找答案。于是,由Google导引至网站的流量势将大幅下跌,以致广告收入流失。


   游戏新闻网站TechRaptor首席执行长拉特利奇·道格特(Rutledge Daugette)认为,Google的AI搜寻使用网上内容出版商花时间和精力来创作的高质内容,生成Snapshot文本,相当于抄袭网站内容。他又批评,好像Google Bard这类聊天机械人在回答用户提问时,不会提供答案所使用的数据源,这没有给内容网站带来任何好处。


   餐厅评论网站Yelp的公共政策主管路德·洛威(Luther Lowe)指出,这次Google Search的更新只是强化其一贯的商业策略——延长用户在Google网站上的停留时间,而不是把他们带引到其他网站。他更狠批,Google将AI导入搜索引擎所产生的排他性,是给整个互联网“放血的最终章”。


未来Google Search将加入“Snapshot”搜寻功能,AI会将搜寻所得数据用文本方式直接呈现出来,右边则有3个方框显示相关网站链接。(图片来源:Google官方网志)


日后当用户使用Google搜寻商品时,AI会根据产品评论、评分、价格、以及产品描述,为用户推荐合适的产品。(图片来源:Google官方网志)


PaLM 2不仅能使用20多种程序语言,还懂得40种人类语言,惟现阶段只支持英文、日文、以及韩文。(图片来源:Google官方网志)


出版商拟透过法律途径获取补偿


   网上媒体公司IAC/InterActiveCorp.董事长巴里·迪勒(Barry Diller)表示,如果全球所有内容信息都被吸纳到一个巨大黑洞,然后以聊天功能重新包装成各式文案,你想要多少就有多少,你想要多少就有多少,那么世上就不会再有出版业了。他认为,除非Google等AI公司设立向出版商支付内容费用的机制,否则就不应抓取网站内容,并强调出版业者可以根据版权法起诉AI公司。


   然而,出版商面临的最大挑战是,难以确认他们的内容是否有被AI使用。Google没有透露PaLM 2模型所用的训练数据是来自什么地方。Google研究副总裁祖宾·加赫拉马尼(Zoubin Ghahramani)只称:“PaLM 2是通过对互联网上的各种公开可用数据进行训练。”


   无论如何,美国媒体业者已开始探索,透过法律途径向AI公司争取赔偿。代表美加近2,000家传媒和出版商的“新闻媒体联盟”(News Media Alliance)现正研究,网上媒体内容在多大程度上被用于训练Bard、ChatGPT等AI模型,并讨论如何索偿和法律选项。


   新闻媒体联盟执行副总裁兼总法律顾问丹妮尔·科菲(Danielle Coffey)表示,网站上的高质内容是媒体机构不断投入资源、记者和编辑辛勤工作的成果,但现在却被其他人用来创造收入,故此必须获得补偿。据悉,该联盟已准备向Google和微软(Microsoft)等AI巨头正式摊牌。


Reddit将向AI公司收数据使用费


   另一边厢,美国最大讨论区Reddit也决定,向使用其内容数据的AI公司收费。Reddit执行长史蒂夫·霍夫曼(Steve Huffman)指出,讨论区上存有很多网民真实对话记录,Bard、ChatGPT的AI模型可以透过Reddit的讨论串学习人类如何谈论不同议题与表达观点,从中获益匪浅。他强调,不能把这些有价值的数据白白送给AI公司使用,故此拟于2023年6月推出数据使用方案,要求这些公司付费后才可通过API读取Reddit的数据。


   由此看来,不论是网上出版商、抑或社交媒体平台都积极部署,如何向Google、Microsoft,以至OpenAI等征收费用。但Google发言人已表示,该公司目前没有计划向出版商作出任何补偿。


   事实上,AI侵权问题现已是国际头等大事之一。七大工业国集团(G7)在广岛峰会上表示,生成式AI发展速度和规模,已超出监管法规的制约能力,因此同意于2023年年底前设立部长级论坛“广岛AI进程”(Hiroshima AI Process),讨论生成式AI带来的知识产权与虚假信息等问题。G7领袖又呼吁,应尽快建立一套国际技术标准,以规范AI的应用,务求令AI变得“更值得信任”。


   可是,一旦过度立法,有可能窒碍AI技术进步。严格的法规可能导致开发商和投资者失去创新动力和投资意愿。纵然政府应加强AI监管,但不是推出耸人听闻的禁令,而是提供框架让AI开发变得更加安全。政策者需要跟AI业者合作,维持开放和容许合理风险的氛围,方可让AI产业发展达至合理的平衡。


Reddit已宣布,日后AI公司要读取讨论区上的内容将要收取数据使用费。(图片来源:翻摄Reddit官网)


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

上一篇欧盟、加国抢先立法!OpenAI建议华府成立专责监管机构
下一篇AI可能导致人类灭亡?白宫下令评估,欧盟拟立法监管
评论
我来说两句1