AI公司Anthropic因盗用书籍训练模型被判赔15亿美元

快速阅读: 人工智能公司Anthropic因非法使用书籍训练模型，同意以15亿美元赔偿作者和出版商，每人每本书至少3000美元。此事引发关于AI版权及报酬的讨论，特朗普认为不应支付费用。

十亿美元已不如往昔那般具有影响力，但仍能引起重视。当我得知人工智能公司Anthropic同意至少以15亿美元赔偿那些书籍被用于训练其大型语言模型Claude的作者和出版商时，我对此深有体会。此前，法官作出简易判决，认定该公司非法使用了这些书籍。据报道，这项仍需法官审慎审查的协议将向每位作者每本书支付至少3000美元。我写了八本书，而我的妻子也有五本。这笔钱足以翻新我们的浴室！

尽管此次和解是基于盗版书籍，但它并未真正触及AI公司是否有权在未经许可的情况下使用受版权保护的作品来训练其模型的核心问题。然而，金钱的介入使这一问题变得更为实际。在此之前，关于AI版权的争论多基于法律、道德甚至政治假设。现在事情已经到了实处，是时候解决根本问题了：既然顶尖AI依赖于书籍内容，公司是否应该在构建价值万亿美元的业务时支付给作者报酬？

撇开法律不谈，我一直在这个问题上挣扎。但随着事态从法庭转向支票，我的看法也发生了变化。我理应得到那些钱！支付作者的费用似乎是正确的做法，尽管包括美国总统唐纳德·特朗普在内的强大势力持反对意见。

重要免责声明

在继续之前，我要做一个重大的免责声明。如前所述，我自己是一名作者，因此我可能从这场争论的结果中获益或受损。此外，我还是美国作家协会理事会成员，该协会强烈支持作者权益，并起诉OpenAI和微软在其训练过程中使用了作者的作品。（由于我负责报道科技公司，我在涉及这些公司的诉讼投票中选择回避。）今天，我显然只是代表个人发言。

过去，我在理事会内部一直是个秘密的异见者，对于公司是否有权使用合法购买的书籍训练模型的问题感到纠结。认为人类正在构建一个庞大的人类知识库的观点确实引起了我的共鸣。2023年，我采访艺术家Grimes时，她对成为这一实验的一部分表示兴奋：“哦，太棒了，我可能会永生！”她说。这种观点也触动了我。广泛传播我的意识是我热爱工作的一个重要原因。

但是，将一本书嵌入由大型企业构建的语言模型中则是另一回事。请注意，书籍可能是AI模型可以吸收的最有价值的语料库。它们的长度和连贯性是人类思想的独特导师。它们涵盖的主题广泛且全面，比社交媒体更加可靠，比新闻文章提供更深的理解。可以说，没有书籍，大型语言模型将弱得多。

因此，有人认为OpenAI、谷歌、Meta、Anthropic等公司应当为获取书籍支付高昂的费用。上月底，在那次令人遗憾的白宫技术晚宴上，各CEO轮流向特朗普展示他们声称在美国数据中心投资的巨额资金，以满足AI的计算需求。苹果承诺投资6000亿美元，Meta表示将匹配这一数额。OpenAI是名为Stargate的5000亿美元合资企业的一部分。相比之下，Anthropic作为侵权案件和解的一部分，同意向作者和出版商分配的15亿美元并不那么显眼。

不公平的使用

尽管如此，法律可能站在这些公司一边。版权法允许所谓的“合理使用”，即基于某些标准无需支付报酬即可利用书籍和文章，其中一个标准是使用是否“具有变革性”——即是否以创新方式建立在书本内容之上，而不与原始产品竞争。负责Anthropic侵权案的法官裁定，使用合法获得的书籍进行训练确实受到合理使用的保护。确定这一点是一项尴尬的任务，因为我们所依据的法律标准是在互联网乃至AI出现之前制定的。

显然，需要一个基于当代情况的解决方案。今年五月宣布的白宫AI行动计划并未提供这样的方案。但在关于该计划的讲话中，特朗普对此发表了看法。他认为作者不应得到报酬——因为建立一个公平支付系统的难度太大。“你不能期望有一个成功的AI项目，当每一篇文章、书籍或你读过的任何东西都需要支付费用时，”特朗普说。“我们感谢这一点，但就是做不到——因为这是不可能实现的。”（一位政府消息人士本周告诉我，这一声明“定下了官方政策的基调”。）

(以上内容均由Ai生成)