美国版权局关于 AI 训练的报告草案在合理使用方面存在错误
快速阅读: 据《电子前线基金会》最新报道,美版权局关于AI训练的报告在公平使用问题上严重偏袒版权持有者,混淆了训练与输出,误用公平使用原则。法院不应采纳此报告,而应依据先例裁决。
在未来十年内,生成式人工智能或许会像计算机和电力一样,成为历史上最具变革性的技术之一,这既蕴含着巨大的机遇,也伴随着不可忽视的风险。政府对生成式人工智能的回应,包括新的法律先例,需要妥善应对现实世界中的危害,同时不能破坏这项技术能带来的公共利益。遗憾的是,美国版权局关于人工智能训练的仓促起草报告未能准确把握这一关键点。该报告在公平使用问题上的处理存在严重偏差。
这份报告在一系列有争议的裁员中发布,涵盖了各种复杂程度的问题。但在核心法律问题上——即使用受版权保护的作品来训练生成式人工智能是否属于公平使用——报告出现了重大失误。它错误地应用了长期确立的公平使用原则,并最终偏向版权持有人,牺牲了创造力和创新。
该报告在公平使用问题上的处理存在严重偏差。当今的生成式人工智能系统需要在非常庞大的人类创作作品集合上进行训练——可能达到数百万件。在这个规模下,即使是最大的、最富有的人工智能公司也难以找到版权所有者并获得许可,而对较小的竞争者来说更是不可能的。然而,如果训练被视为合理使用,则无需获得许可。目前,法院正在考虑数十起涉及生成式人工智能训练公平使用的诉讼案件。联邦地区法官文斯·查布拉里即将对此问题作出裁决,此前他听取了卡德雷诉元平台案的口头辩论。第三巡回上诉法院预计将在汤森路透诉罗斯情报案中考虑类似的公平使用问题。法院有能力通过适用现有法律来解决这一关键问题。法院应拒绝版权局的公平使用分析。
该报告的公平使用讨论包含一些根本性错误,偏向权利持有者。尽管该报告是非约束性的,但它可能会影响法院,包括在卡德雷案中,原告已经提交了报告副本并敦促法院采纳其分析。然而,法院只需接受版权局的初步结论,如果这些结论具有说服力的话。它们并不具有说服力。版权局的公平使用分析不应被法院采纳。它反复混淆了用于训练模型的行为(这是构建生成式人工智能模型过程中的必要步骤)与使用模型创建实质性相似作品的行为。它还错误地应用了基本的公平使用原则,并接受了从未被任何法院认可的新市场伤害理论。
第一个问题是版权局对转化性使用的分析。高度转化性的使用——那些服务于原作不同目的的使用——很可能是公平的。法院通常认为使用受版权保护的作品来构建新软件和技术(包括搜索引擎、电子游戏和移动应用程序)是高度转化性的,因为它服务于新的和独特的目的。此处,原作是为多种目的而创作的,用它们来训练大型语言模型显然是不同的。报告试图回避这一结论,不断忽视实际使用的训练行为,转而关注模型可能最终如何使用。如果模型最终主要用于创建与训练其上的原始作品相似的一类作品,办公室认为,那么中间复制就不能被视为转化性的。这从根本上曲解了转化性使用,应该取决于模型本身是否是一种新的创造,具有自己的独特目的,而不是其潜在用途是否会影响对其训练的作品的需求——这是一个与几十年来的先例相悖的可疑标准。
版权局的转化性使用分析还暗示公平使用分析应考虑作品是否以“恶意”获取,以及开发者是否尊重“控制”使用受版权保护作品的权利。“但最高法院对恶意在公平使用分析中的作用持怀疑态度,并明确表示公平使用不是为表现良好的人保留的特权。权利持有人没有权利控制公平使用——这正是关键所在。
最后,办公室采用了全新的且严重误导的“市场伤害”理论。传统上,公平使用分析要求法院考虑使用对相关作品市场的效果。版权局建议法院应考虑模型整体使用对产生类似作品的影响。按照这个逻辑,如果一个模型是在《布里奇顿》小说(在数百万其他作品中)上训练的,并由第三方用于生产浪漫小说,这可能会损害系列作者朱莉娅·奎因的底线。这种市场稀释理论有四个根本问题。首先,像转化性使用分析一样,它混淆了训练与输出。其次,它没有任何相关先例支持。第三,它完全基于一种推测,即布里奇顿粉丝会购买随机的“浪漫小说”,而不是他们所熟知和喜爱的畅销书作家的作品。这建立在缺乏证据的惊人假设之上,包括同一类型的任何作品都是彼此的良好替代品——无论它们的质量、原创性或声誉如何。最后,即使来自其他独特作品的竞争可能会减少销售额,这也不是反对公平使用的那种市场伤害类型。此外,公平使用许可证的收入损失也不是法律应承认的市场伤害类型。
优先考虑私人许可市场的“解决方案”将极大地扩大主要媒体公司的市场权力,并抑制版权旨在促进的创造力和创新。事实上,公平使用原则的存在部分是为了给从留声机唱片到录像机再到互联网本身的技术创新创造空间。如果没有公平使用,沉重的版权责任可能会阻碍人工智能技术的发展。
我们仍在消化这份报告,但我们的初步审查表明,总体而言,版权局关于生成式人工智能训练的公平使用方法并不是一份冷静地报告现有版权法如何适用于这项新技术的报告。这是一个关于生成式人工智能技术对未来创造力价值的政策判断,而这个办公室无权制定新的、脱离实际的政策。法院不应遵循版权局关于生成式人工智能的推测。他们应当遵循先例。
(以上内容均由Ai生成)