针对 Meta 的盗版诉讼可能为在 AI 训练中下载受版权保护的作品开创先例
快速阅读: 据《技术点》最新报道,元宇宙公司因涉嫌用盗版书籍训练AI被起诉,原告申请简易判决,若胜诉可能改变AI训练版权规则,法官需理解BT下载技术后再作裁决。
棘手问题:**元宇宙公司**陷入了一场具有开创性的AI诉讼案,这场诉讼可能改变法院对版权法的看法。从原告的角度来看,这个案件似乎无懈可击。然而,如果法官持不同意见,它可能会确立一个重要的先例,允许公司利用受版权保护的材料来训练AI系统。
2024年1月,一群作家在加州对**元宇宙公司**提起诉讼,指控其使用他们的作品来训练各种版本的**丽娜大语言模型**。**元宇宙公司**公开承认使用了**书集3**数据集,这是一个包含195,000本受版权保护书籍的众所周知的37GB集合,自2020年以来开发人员一直用它来训练大型语言模型(LLMs)。该公司为其行为辩护,引用了“合理使用”条款。
今年早些时候,法院解封了文件,显示**元宇宙公司**曾使用BT下载来收集其AI训练数据。周一,作者们在加利福尼亚州美国地区法院申请部分简易判决,声称**元宇宙公司**涉嫌使用盗版数据的行为没有任何法律模糊性可言。
原告方指出,**元宇宙公司**通过BT下载获取受版权保护书籍用于人工智能训练的行为构成了明确的版权侵权。“无论生成式人工智能(GenAI)有何种优点,从互联网上窃取受版权保护的作品以谋取私利一直是非法的,”作者在其诉状中表示。
根据解封的文件,**元宇宙公司**最初尝试逐本下载盗版书籍,但这一过程过于缓慢且对其网络造成了过度压力。随后,该公司据称转向了BT下载——一种长期以来与版权侵权相关的著名文件共享方法,以大量获取超出**书集3**数据集范围的受版权保护书籍。
Ars Technica获得的被大幅删减的动议指出,BT下载用户通常会下载(吸血)和上传(播种)文件的部分内容以便更快地下载。如果文件包含受版权保护的内容,下载和上传通常被视为非法。此外,通过播种,**元宇宙公司**可能主动促进了盗版行为,即分发受版权保护的书籍。
原告认为无需审判即可作出裁决,并寻求立即判决。作者们主张该公司的行为明显违反了版权法,远远超出了**元宇宙公司**的合理使用辩护范围。如果**元宇宙公司**胜诉,这将为其他AI开发者打开大门,让他们可以未经版权所有者补偿的情况下侵犯版权。
“尽管如此,法院仍应根据四个公平使用因素裁定**元宇宙公司**决定向其他点对点盗版者提供数百万本受版权保护书籍以换取更快下载速度的行为,”动议指出。
虽然看起来是一个相对简单明了的案件,但负责此案的法官文斯·查布里亚承认他对BT下载以及播种、吸血等术语并不熟悉。因此,查布里亚法官可能会拒绝简易判决动议,选择听取专家证词并解释案件,以便他能够做出公正诚实的裁决。
无论结果如何,这场诉讼的最终裁决都将具有开创性意义。如果**元宇宙公司**获胜,它将为其他AI开发者打开利用书籍、图像或视频进行模型训练的大门。如果作者们胜诉,它将为类似案件设定先例,包括目前仍在司法系统中的案件。这还可能导致进一步的版权调整,类似于数字千年版权法案。
注:文中涉及的公司名、人名、术语均按照音译处理。
(以上内容均由Ai生成)