学者控告苹果公司使用盗版书籍训练 AI,版权之争再掀波澜
快速阅读: 美国纽约州两位教授起诉苹果,指控其未经授权使用包含他们著作的盗版书库 Books3 训练 AI 模型,若被认定“蓄意侵权”,苹果或将面临高额赔偿。
近日,美国纽约州 SUNY 健康科学大学的两位教授苏珊娜·马丁内斯-康德和史蒂芬·马克尼克对苹果公司提起集体诉讼,指控苹果在训练其 Apple Intelligence 人工智能模型时,未经许可使用了包含他们著作的盗版书库 Books3。这一事件再次引发公众对人工智能训练过程中版权问题的关注。
根据诉状,这两名教授的书籍《错觉冠军:令人费解的图像和神秘大脑谜题背后的科学》和《心灵骗局:神经科学揭示日常欺骗》被用于训练 Apple Foundation Intelligence Models 和 OpenELM 语言模型。诉状指出,苹果在未取得相关授权的情况下,不仅复制了他们的作品,还将其用于测试模型性能及作为过滤器,以防止版权内容出现在终端用户面前。
Books3 曾是广泛用于人工智能训练的“影子图书馆”,其中收录了来自 Bibliotik 私有 BitTorrent 追踪器的186,640本图书文本。苹果公司在2024年4月发布 OpenELM 时,承认使用了“The Pile”数据集,该数据集确实包含了 Books3 的内容。目前,由于版权问题,Books3 已于2023年10月下架。
此案引起关注的原因有二:一是作者应获得其作品被再利用和复制的法律补偿;二是人工智能训练中对读物版权的合法性问题仍存广泛争议。例如,Google 经常使用未授权的内容进行 AI 摘要展示,且往往不注明内容来源,导致创作方难以获得应有权益。
美国法院在 Midjourney 相关案件中指出,AI 训练阶段的溯源和补偿难以实现。然而,在最近的 Anthropic 案件中,法官认为将训练用的书籍集中存储于中央数据库可能构成直接版权侵犯。如果法院认定苹果为“蓄意侵权”,每本书可能面临最高15万美元的赔偿。
目前,两位教授要求陪审团审判、经济赔偿,并禁止苹果未来继续使用他们的作品。苹果方面尚未对诉讼的具体内容作出公开回应。尽管诉状提到 Apple Intelligence 发布当天苹果市值增加了2000亿美元,但过去五年内,苹果的市值增幅曾有四次超过此次,表明此事件的市场影响还需进一步观察。
要点总结:
– 学者对苹果提起诉讼,指控其未经授权使用盗版书籍训练 AI。
– Books3 被称为“影子图书馆”,收录了大量未经授权的书籍文本。
– 若被认定为“蓄意侵权”,苹果将面临高额赔偿风险。
(以上内容均由Ai生成)