方展策

少年时，曾研习 Geographic Information System，可惜学无所成，侥幸毕业。成年后，误打误撞进入传媒圈子，先后在印刷、电子、网络媒体打滚，略有小成。中年后，修毕信息科技硕士，眼界渐扩，决意投身初创企业，窥探不同科技领域。近年，积极钻研数据分析与数码策略，又涉足 Location Intelligence 开发项目；有时还会抽空执教鞭，既可向他人分享所学，亦可鞭策自己保持终身学习。

谷歌AI反击战！直接生成答案，将损害全球网站利益？

2023-05-22 16:29

1A+A-

为抗衡ChatGPT，Google今年2月发表聊天机械人Bard，但普遍被认为比不上前者，以致股价暴跌。事隔3个月，该公司在Google I／O开发者大会上，可以拿出什么石破天惊的新产品来扳回一城，遂成为全球科技界焦点。结果，Google只是平实地端出升级版Bard与新大型语言模型PaLM 2。但外界对此做法却表示赞许，认为Google没有说些不切实际的伟大愿景，而是老老实实地改良产品，并示范AI如何融入旗下各种网上服务，展示有能力持续发展AI的证据，反而让人更有信心。

Google深耕AI多年却未获关注

回顾历届Google I/O大会，AI一直是重点主题。早在I/O 2017上，执行长皮查伊（Sundar Pichai）已宣告，Google是“以AI为核心的公司”。I／O 2021上，Google发表了对话AI模型LaMDA，宣称其理解对话上下文的能力，远胜当时所有大型语言模型。I／O 2022上，Google宣布LaMDA 2的诞生，表示新模型深度结合AI与机器学习技术，能够就看似无穷无尽的话题，进行自由而流畅的对话。

即使Google大肆吹嘘LaMDA系列模型有多厉害，但却始终无法引起太大关注。直至OpenAI于2022年11月推出ChatGPT，才真正让生成式AI与大型语言模型红起来。眼看自己深耕多年的领域，突然被一家名不经传的小公司独领风骚，令Google变得无比焦虑，2023年5月10日，终于来到新一届I/O大会。Google在会上提及“AI”接近200次，除升级版Bard外，还一口气发表25项建基于PaLM 2模型上的新功能，几乎把AI整合至Google Search、Google Maps、Google Docs、Gmail等所有服务。由此可见，Google急于向所有人证明，它依然是一家顶尖的AI公司。

Google在I/O 2023大会上发表新一代大型语言模型PaLM 2，比起2022年推出的上一代模型，在多语言处理、推理和编程能力方面有很大提升。（图片来源：翻摄Google官方YouTube影片）

Bard以文字搭图片回答用户提问

我们先来看看Bard的3大升级功能。首先，Bard能够以图片回答你的提问。假如你询问Bard：“新奥尔良有哪些必去景点？”Bard回复的答案除文字外，也会配上图片，让你可以先看看新奥尔良的风景。

同时，Google又将Google Lens的视觉分析功能整合到Bard，让它不但可以图片回答，还可以看懂图片。譬如上传狗仔相片，并要求Bard生成有趣的文案，它就会自行理解相片中狗只的品种，然后产出与狗仔相关的文案。

其次，Bard也针对编程工作上作出优化。当编程人员要求Bard协助编写程序代码，倘若当中引用了一段他人的程序代码，只要点击“标注”，Bard即会把引用部分标记底线，并提供来源连结，方便编程人员查核。Bard又会推出编程人员最喜欢的深色模式，让接口可以变成黑底白字，以减轻眼睛负担。此外，Google跟网上开发平台Replit合作，可以把Bard生成的程序代码汇出到Replit直接执行。

在Bard上输入提示词“What are some must-see sights in New Orleans?”，AI生成有图片辅助的文本答案，方便用户先看看New Orleans的风景。（图片来源：Google官方网志）

将两只狗的相片上传到Bard，只输入提示词“Write a funny caption about these two”，什么也没解释，Bard就自行理解相中狗只的品种，并提供几组相关的图片说明供用户选择。（图片来源：Google官方网志）

Bard融入各项Google网上服务

其三，Bard将与Google网上服务全面整合。Google为Google Workspace推出一个AI助手机械人“Duet AI”。当你利用Google Slides制作简报时，想为简报加入图片，便可以要求Duet AI帮手生成图片；如你不满意图片效果，可以另行设定图片风格，再要求Duet AI产出新作品。再者，用户请求Bard帮忙草拟电邮和文件后，也可以直接汇出到Gmail和Google Docs，免去“Copy & Paste”的运作，直接替你无缝转移文字内容。

面对Bing Chat的威胁，Google亦会将AI整合到Google Search，推出新形态的搜寻接口“Snapshot”。当用户输入关键词后，如AI判断这不属于商业性搜索，便会把搜寻到的资料整理成一段文本答案，列在搜寻结果页面的最上方；如判定为具有商业性的搜索，页顶依然会显示搜寻广告。

如此一来，Google完全颠覆了一直以来提供信息的方式：从以往纯粹提供相关网页链接的清单，变成供应由AI生成的自家内容，但同时又保留了广告版面的曝光机会，此做法备受外界看好。因此，Google母公司Alphabet Inc.的Class A股在I／O大会后持续上涨，及至5月19日收122.76美元，创2022年8月16日以来收盘新高，已将ChatGPT在2022年11月推出后的失土全部收复。

Google与Adobe合作，把后者的AI绘图技术“Firefly”整合至Bard，让用户可以要求Bard生成图片。有了Adobe的支持，图片版权与画质问题都一并解决了。（图片来源：Google官方网志）

用户利用Google Slides制作简报时，如想加入图片，只要在右边侧栏的对话框输入提示词，Duet AI便可以为简报生成图片。（图片来源：Google官方网志）

生成式搜寻或损害内容网站收益

不过，有人欢笑有人愁。不少网上内容供货商担心，这种生成式搜寻体验（Search Generative Experience）很有可能会影响到旗下网站流量。一旦Google全面推出Snapshot功能，用户可以直接在Google搜寻页面上获得想知的答案，根本无需再点击搜寻结果的网页连结，前往其他网站找答案。于是，由Google导引至网站的流量势将大幅下跌，以致广告收入流失。

游戏新闻网站TechRaptor首席执行长拉特利奇·道格特（Rutledge Daugette）认为，Google的AI搜寻使用网上内容出版商花时间和精力来创作的高质内容，生成Snapshot文本，相当于抄袭网站内容。他又批评，好像Google Bard这类聊天机械人在回答用户提问时，不会提供答案所使用的数据源，这没有给内容网站带来任何好处。

餐厅评论网站Yelp的公共政策主管路德·洛威（Luther Lowe）指出，这次Google Search的更新只是强化其一贯的商业策略——延长用户在Google网站上的停留时间，而不是把他们带引到其他网站。他更狠批，Google将AI导入搜索引擎所产生的排他性，是给整个互联网“放血的最终章”。

未来Google Search将加入“Snapshot”搜寻功能，AI会将搜寻所得数据用文本方式直接呈现出来，右边则有3个方框显示相关网站链接。（图片来源：Google官方网志）

日后当用户使用Google搜寻商品时，AI会根据产品评论、评分、价格、以及产品描述，为用户推荐合适的产品。（图片来源：Google官方网志）

PaLM 2不仅能使用20多种程序语言，还懂得40种人类语言，惟现阶段只支持英文、日文、以及韩文。（图片来源：Google官方网志）

出版商拟透过法律途径获取补偿

网上媒体公司IAC/InterActiveCorp.董事长巴里·迪勒（Barry Diller）表示，如果全球所有内容信息都被吸纳到一个巨大黑洞，然后以聊天功能重新包装成各式文案，你想要多少就有多少，你想要多少就有多少，那么世上就不会再有出版业了。他认为，除非Google等AI公司设立向出版商支付内容费用的机制，否则就不应抓取网站内容，并强调出版业者可以根据版权法起诉AI公司。

然而，出版商面临的最大挑战是，难以确认他们的内容是否有被AI使用。Google没有透露PaLM 2模型所用的训练数据是来自什么地方。Google研究副总裁祖宾·加赫拉马尼（Zoubin Ghahramani）只称：“PaLM 2是通过对互联网上的各种公开可用数据进行训练。”

无论如何，美国媒体业者已开始探索，透过法律途径向AI公司争取赔偿。代表美加近2,000家传媒和出版商的“新闻媒体联盟”（News Media Alliance）现正研究，网上媒体内容在多大程度上被用于训练Bard、ChatGPT等AI模型，并讨论如何索偿和法律选项。

新闻媒体联盟执行副总裁兼总法律顾问丹妮尔·科菲（Danielle Coffey）表示，网站上的高质内容是媒体机构不断投入资源、记者和编辑辛勤工作的成果，但现在却被其他人用来创造收入，故此必须获得补偿。据悉，该联盟已准备向Google和微软（Microsoft）等AI巨头正式摊牌。

Reddit将向AI公司收数据使用费

另一边厢，美国最大讨论区Reddit也决定，向使用其内容数据的AI公司收费。Reddit执行长史蒂夫·霍夫曼（Steve Huffman）指出，讨论区上存有很多网民真实对话记录，Bard、ChatGPT的AI模型可以透过Reddit的讨论串学习人类如何谈论不同议题与表达观点，从中获益匪浅。他强调，不能把这些有价值的数据白白送给AI公司使用，故此拟于2023年6月推出数据使用方案，要求这些公司付费后才可通过API读取Reddit的数据。

由此看来，不论是网上出版商、抑或社交媒体平台都积极部署，如何向Google、Microsoft，以至OpenAI等征收费用。但Google发言人已表示，该公司目前没有计划向出版商作出任何补偿。

事实上，AI侵权问题现已是国际头等大事之一。七大工业国集团（G7）在广岛峰会上表示，生成式AI发展速度和规模，已超出监管法规的制约能力，因此同意于2023年年底前设立部长级论坛“广岛AI进程”（Hiroshima AI Process），讨论生成式AI带来的知识产权与虚假信息等问题。G7领袖又呼吁，应尽快建立一套国际技术标准，以规范AI的应用，务求令AI变得“更值得信任”。

可是，一旦过度立法，有可能窒碍AI技术进步。严格的法规可能导致开发商和投资者失去创新动力和投资意愿。纵然政府应加强AI监管，但不是推出耸人听闻的禁令，而是提供框架让AI开发变得更加安全。政策者需要跟AI业者合作，维持开放和容许合理风险的氛围，方可让AI产业发展达至合理的平衡。

Reddit已宣布，日后AI公司要读取讨论区上的内容将要收取数据使用费。（图片来源：翻摄Reddit官网）

《经济通》所刊的署名及／或不署名文章，相关内容属作者个人意见，并不代表《经济通》立场，《经济通》所扮演的角色是提供一个自由言论平台。