首页香港脉搏理财/管理
港股强化版MQ
方展策

方展策

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

ChatGPT吃霸王餐?纽约时报状告OpenAI、微软侵权!

2024-01-22 14:06
0A+A-

   ChatGPT爆红虽然造就了逾千亿美元产值的生成式AI产业,但也让传媒和出版业者感到威胁,认为科技巨头未经许可使用其内容来训练和开发AI模型,形同吃霸王餐,故陆续有作家或传媒人状告AI公司侵权。近日美国著名报业《纽约时报》终于坐不住,决定对OpenAI与Microsoft提告,代表新闻业对AI巨头开出第一枪。一旦法院对这宗官司作出裁决,将成为往后的重要参考案例,足以左右科技业与传媒业的未来发展,所以份外惹人注目。


ChatGPT未经许可用纽时内容


   2023年12月27日,纽约时报公司(The New York Times Company)跑到曼哈顿联邦地方法院,控告OpenAI与微软(Microsoft)非法使用该报内容来训练和开发ChatGPT与Bing Chat(现已改名为Copilot);当聊天机械人被问到涉及新闻或时事的问题时,可能会依照《纽约时报》的内容来回复用户。该公司认为,倘若用户满意AI的解答,就不会浏览《纽约时报》网站,导致网站流量下降,损害其广告和订阅收入。


   纽约时报公司表示,GPT大型语言模型所用的某个AI训练数据库中,《纽约时报》属第三大的数据源,仅次于维基百科、以及美国专利文件数据库,因此OpenAI与微软应对其非法复制和使用该报内容所造成的数十亿美元法定(Statutory)和实际(Actual)损害负责;同时,又要求被告销毁任何有使用《纽约时报》版权内容的AI模型和相关训练数据库。


纽约时报公司指出,OpenAI的ChatGPT与微软的Copilot在未经许可下近乎逐字摘录《纽约时报》的报道内容,已经超越了“合理使用”的界线。(图片来源:维基百科)


OpenAI:纽时指控欠合理依据


   尽管诉讼状未有提出确切的索偿金额,但却列出《纽约时报》与其附属品牌合共6,000多万项被OpenAI与微软用于训练AI模型的内容记录。根据美国联邦版权法,每项蓄意侵权行为最高可被判罚款15万美元(约117万港元),如以6,000万项内容条目计算,罚金可能高达9兆美元(约70.2兆港元),这对财雄势大的微软可能冲击有限,但对OpenAI这家初创企业却是沉重的财务打击。


假如纽约时报的诉讼取得胜诉,OpenAI与微软将被要求支付高额的版权费用,这可能会增加ChatGPT与Copilot的营运成本,间接影响到用户。(图片来源:翻摄Microsoft官网)


   OpenAI响应指,纽约时报的指控缺乏合理依据,并重申使用网上公开数据来训练AI模型,属于“合理使用”(Fair Use)范围。该公司强调,“合理使用”原则对创作者公平,对创新者必要,对美国竞争力更是非常重要。


AI模型训练的合理使用存争议


   这宗官司的胜败关键正在于,OpenAI与微软的做法是否真的符合版权法中的“合理使用”原则:在特定情况如教学、评论、研究、或新闻报道之下,允许他人不经版权持有人许可,都可以使用特定作品。构成“合理使用”的大前提是,生成式AI必须创造出新内容,而不是重现作品本身,即是“转化性使用”(Transformative Use);同时,新内容亦不会损害原本作品的市场。


   纽约时报公司自2023年4月起已跟OpenAI进行协商,尝试找出符合双方利益的合作方案,可是一直未能达成共识,个中原因或许是双方对“合理使用”的看法各有不同。事实上,“合理使用”原则是否适用于AI模型训练,目前尚无明确案例可援,所以纽时决定提起诉讼,交由法庭判决。


版权问题是AI发展的最大障碍


   纽约大学科技法律及政策诊所(Technology Law and Policy Clinic)负责人杰森·舒尔茨(Jason Schultz)认为,在图书被擅用于AI训练方面,OpenAI的论点颇具说服力。纽约时报代表律师则重申,OpenAI未经许可使用该报新闻内容不符合“合理使用”,因为只要用户可以透过ChatGPT取得局部新闻信息,便不会去新闻网站阅读整篇报道,所以它有可能成为新闻的替代品,损害原有市场。


   范德堡大学(Vanderbilt University)知识产权计划联席主任丹尼尔·热维斯(Daniel Gervais)指出,版权问题始终是悬在AI公司头上的一把大刀,除非他们找出解决办法,否则这把刀会一直悬挂在那里,限制着生成式AI的未来发展。


OpenAI四出奔走洽谈内容授权


   有鉴于此,OpenAI现正积极跟数十家出版商洽谈作品授权事宜。2023年7月,该公司公布跟美联社(Associated Press)达成合作协议,能够存取1985年至今的新闻数据库,而美联社也可以获得OpenAI的技术使用权。12月该公司又宣布,与欧洲新闻集团阿克塞尔·斯普林格(Axel Springer)签署授权协议,可以使用Business Insider、Politico等媒体内容来训练AI模型。


OpenAI已获得欧洲新闻集团Axel Springer的内容授权,日后用户可以透过ChatGPT读取该集团旗下媒体的新闻摘要和数据源链接。(图片来源:Freepik图库)


   根据瑞银的最新研究报告,全球对生成式AI的需求日益扩大,AI模型与工具的收入可望从2022年的22亿美元(约171.6亿港元),暴增至2027年的2,250亿美元(约171.6亿港元)。面对如此庞大的产值规模,OpenAI作为AI市场龙头,理应可以坐享其成,但纽约时报的提告却有可能为这家初创带来没顶之灾,迫使其退出市场。由是之故,这宗官司的判决既对OpenAI构成生存挑战,也将对AI发展造成深远影响,值得大家日后多加关注。


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

上一篇苹果Vision Pro热卖背后现隐忧!需求或快速下滑?
下一篇OpenAI建构AI应用平台经济,迈向AI霸权的关键一步!
评论
我来说两句0