“我就是不明白这怎么会是合理使用”,法官在 Meta AI 审判中说
快速阅读: 据《完成音乐更新》最新报道,美国法院审查AI公司用“合理使用”辩护进行模型训练的行为。法官赵胜质疑Meta的辩护,认为其可能“彻底颠覆”原作市场,但需证明对作者作品商业潜力的实际损害。案件影响其他类似诉讼及AI行业。
上星期,美国法院对人工智能公司利用“合理使用”辩护理由为其模型训练无授权内容的行为进行了审查。在一群作者起诉Meta的核心诉讼中,负责此案的法官赵胜(Vince Chhabria)告知这家科技公司:“我真的无法理解这怎么可能是合理使用”。这一评论是在作者与Meta之间关于其从数千本书籍中获取内容以训练Llama模型的法律纠纷背景下提出的。
有时,赵胜法官似乎完全不认同“合理使用”辩护适用于人工智能训练。据路透社报道,他告诉Meta的律师,他们使用受版权保护的材料来训练人工智能,这意味着他们可以“创造出一种能够生产无数竞争产品的成果”。结果是Meta正在“极大地改变——甚至可以说是彻底颠覆——那个人作品的市场”,甚至无需向那个人支付许可费用。然后他颇为引人注目地总结说:“我真的无法理解这怎么可能是合理使用”。
尽管这表明赵胜法官可能倾向于作者在本案中的主张,但他也对作家的法律顾问表示,案件的结果可能取决于他们能否证明Meta的Llama模型会损害作者作品的商业潜力。他补充道,这一点尚未得到证实。
喜剧演员莎拉·西尔弗曼和小说家理查德·卡德雷是起诉Meta的作者之一,指控这家科技公司在为Llama构建训练数据集时未经许可复制了他们的书籍,侵犯了版权。Meta声称人工智能训练属于合理使用范畴,因此无需获得许可。毋庸置疑,作者们强烈反对。双方均在寻求对自己有利的简易判决,而赵胜法官上周在法庭上正在考虑这些请求。
合理使用论点是众多由美国版权持有人提起诉讼的核心。这意味着随着首批案件进入法庭,合理使用辩护的裁决将对其他所有诉讼产生影响。此前,一位法官在汤森路透与Ross Intelligence的人工智能公司之间的法律纠纷中否定了合理使用辩护,但那涉及的是一个人工智能驱动的搜索引擎,而非生成式人工智能模型。因此,Llama案件的情况对其他所有诉讼更为直接相关。
判断版权保护作品的使用是否构成合理使用的四个主要标准是:首先,使用的目的是什么,包括是否具有“转换性”;其次,受版权保护的作品的性质;第三,所取部分的数量和重要性;第四,使用对受版权保护作品潜在市场或价值的影响。
人工智能公司非常依赖于现有作品的使用是高度转化性的这一论点。与此同时,部分版权持有者认为,人工智能公司经常从网上未经授权的来源抓取内容,这本身应阻止它们使用合理使用辩护,引用判例法中的先例,指出盗版材料无法构成合理使用。
上周,赵胜法官特别关注评估合理使用主张的第四项因素,即Meta使用作者作品对其作品潜在市场或价值的影响。这促使法官指出,通过使用作者的书籍训练Llama,Meta正在“极大地改变——甚至可以说是彻底颠覆——那个人作品的市场”。如此之多,以至于“我真的无法理解这怎么可能是合理使用”。
不过,这并不意味着作者已经明确证明“他们的实际版权作品的市场将因Llama受到重大影响”。赵胜法官对作者的律师说:“看来你在让我推测莎拉·西尔弗曼回忆录的市场会因Llama最终能生产的数十亿事物而受到影响。”但他补充道,他认为这并非显而易见。
这一挑战在于,像Llama这样的生成式人工智能模型的存在可能对未来的作者作品——或者更广泛地说,对这些及其他作家的职业生涯——产生更多的负面影响,而不是对过去训练过程中具体复制的书籍产生影响。据《连线》杂志报道,在法庭上,赵胜法官通过提供一个假设的音乐场景暗示了这一点。在思考如果泰勒·斯威夫特的音乐被用于训练生成式人工智能模型是否会对其造成伤害后,他又提出假设,认为如果Meta摄入了一位“相对不知名的艺术家”的作品,那么当模型生产出“十亿流行歌曲”时,这位艺术家的职业生涯很可能会受挫。
这些都是赵胜法官需要进一步深入考虑的问题,因为他正在进一步审查双方在此案中提出的论点。法官承认他的结论将对其他法律争议和整个人工智能行业产生重大影响,因此他需要投入充足的时间加以考量。
在上周听证会结束时,法官打趣道:“我今天晚些时候会发布裁决——开个玩笑——我会花更多时间仔细考虑。”
(以上内容均由Ai生成)