方展策

少年时，曾研习 Geographic Information System，可惜学无所成，侥幸毕业。成年后，误打误撞进入传媒圈子，先后在印刷、电子、网络媒体打滚，略有小成。中年后，修毕信息科技硕士，眼界渐扩，决意投身初创企业，窥探不同科技领域。近年，积极钻研数据分析与数码策略，又涉足 Location Intelligence 开发项目；有时还会抽空执教鞭，既可向他人分享所学，亦可鞭策自己保持终身学习。

ChatGPT吃霸王餐？纽约时报状告OpenAI、微软侵权！

2024-01-22 14:06

0A+A-

ChatGPT爆红虽然造就了逾千亿美元产值的生成式AI产业，但也让传媒和出版业者感到威胁，认为科技巨头未经许可使用其内容来训练和开发AI模型，形同吃霸王餐，故陆续有作家或传媒人状告AI公司侵权。近日美国著名报业《纽约时报》终于坐不住，决定对OpenAI与Microsoft提告，代表新闻业对AI巨头开出第一枪。一旦法院对这宗官司作出裁决，将成为往后的重要参考案例，足以左右科技业与传媒业的未来发展，所以份外惹人注目。

ChatGPT未经许可用纽时内容

2023年12月27日，纽约时报公司（The New York Times Company）跑到曼哈顿联邦地方法院，控告OpenAI与微软（Microsoft）非法使用该报内容来训练和开发ChatGPT与Bing Chat（现已改名为Copilot）；当聊天机械人被问到涉及新闻或时事的问题时，可能会依照《纽约时报》的内容来回复用户。该公司认为，倘若用户满意AI的解答，就不会浏览《纽约时报》网站，导致网站流量下降，损害其广告和订阅收入。

纽约时报公司表示，GPT大型语言模型所用的某个AI训练数据库中，《纽约时报》属第三大的数据源，仅次于维基百科、以及美国专利文件数据库，因此OpenAI与微软应对其非法复制和使用该报内容所造成的数十亿美元法定（Statutory）和实际（Actual）损害负责；同时，又要求被告销毁任何有使用《纽约时报》版权内容的AI模型和相关训练数据库。

纽约时报公司指出，OpenAI的ChatGPT与微软的Copilot在未经许可下近乎逐字摘录《纽约时报》的报道内容，已经超越了“合理使用”的界线。（图片来源：维基百科）

OpenAI：纽时指控欠合理依据

尽管诉讼状未有提出确切的索偿金额，但却列出《纽约时报》与其附属品牌合共6,000多万项被OpenAI与微软用于训练AI模型的内容记录。根据美国联邦版权法，每项蓄意侵权行为最高可被判罚款15万美元（约117万港元），如以6,000万项内容条目计算，罚金可能高达9兆美元（约70.2兆港元），这对财雄势大的微软可能冲击有限，但对OpenAI这家初创企业却是沉重的财务打击。

假如纽约时报的诉讼取得胜诉，OpenAI与微软将被要求支付高额的版权费用，这可能会增加ChatGPT与Copilot的营运成本，间接影响到用户。（图片来源：翻摄Microsoft官网）

OpenAI响应指，纽约时报的指控缺乏合理依据，并重申使用网上公开数据来训练AI模型，属于“合理使用”（Fair Use）范围。该公司强调，“合理使用”原则对创作者公平，对创新者必要，对美国竞争力更是非常重要。

AI模型训练的合理使用存争议

这宗官司的胜败关键正在于，OpenAI与微软的做法是否真的符合版权法中的“合理使用”原则：在特定情况如教学、评论、研究、或新闻报道之下，允许他人不经版权持有人许可，都可以使用特定作品。构成“合理使用”的大前提是，生成式AI必须创造出新内容，而不是重现作品本身，即是“转化性使用”（Transformative Use）；同时，新内容亦不会损害原本作品的市场。

纽约时报公司自2023年4月起已跟OpenAI进行协商，尝试找出符合双方利益的合作方案，可是一直未能达成共识，个中原因或许是双方对“合理使用”的看法各有不同。事实上，“合理使用”原则是否适用于AI模型训练，目前尚无明确案例可援，所以纽时决定提起诉讼，交由法庭判决。

版权问题是AI发展的最大障碍

纽约大学科技法律及政策诊所（Technology Law and Policy Clinic）负责人杰森·舒尔茨（Jason Schultz）认为，在图书被擅用于AI训练方面，OpenAI的论点颇具说服力。纽约时报代表律师则重申，OpenAI未经许可使用该报新闻内容不符合“合理使用”，因为只要用户可以透过ChatGPT取得局部新闻信息，便不会去新闻网站阅读整篇报道，所以它有可能成为新闻的替代品，损害原有市场。

范德堡大学（Vanderbilt University）知识产权计划联席主任丹尼尔·热维斯（Daniel Gervais）指出，版权问题始终是悬在AI公司头上的一把大刀，除非他们找出解决办法，否则这把刀会一直悬挂在那里，限制着生成式AI的未来发展。

OpenAI四出奔走洽谈内容授权

有鉴于此，OpenAI现正积极跟数十家出版商洽谈作品授权事宜。2023年7月，该公司公布跟美联社（Associated Press）达成合作协议，能够存取1985年至今的新闻数据库，而美联社也可以获得OpenAI的技术使用权。12月该公司又宣布，与欧洲新闻集团阿克塞尔·斯普林格（Axel Springer）签署授权协议，可以使用Business Insider、Politico等媒体内容来训练AI模型。

OpenAI已获得欧洲新闻集团Axel Springer的内容授权，日后用户可以透过ChatGPT读取该集团旗下媒体的新闻摘要和数据源链接。（图片来源：Freepik图库）

根据瑞银的最新研究报告，全球对生成式AI的需求日益扩大，AI模型与工具的收入可望从2022年的22亿美元（约171.6亿港元），暴增至2027年的2,250亿美元（约171.6亿港元）。面对如此庞大的产值规模，OpenAI作为AI市场龙头，理应可以坐享其成，但纽约时报的提告却有可能为这家初创带来没顶之灾，迫使其退出市场。由是之故，这宗官司的判决既对OpenAI构成生存挑战，也将对AI发展造成深远影响，值得大家日后多加关注。

《经济通》所刊的署名及／或不署名文章，相关内容属作者个人意见，并不代表《经济通》立场，《经济通》所扮演的角色是提供一个自由言论平台。