揭秘：Meta 令人震惊地暂停 AI 训练数据的书籍许可

快速阅读: 《比特币世界》消息，脸书暂停了为人工智能训练获取图书许可的努力，此举引发关于生成式人工智能时代合理使用和知识产权的辩论。脸书面临出版社冷淡回应、可扩展性问题及权利所有权障碍。同时，版权诉讼指责脸书使用“影子图书馆”训练AI。这反映了人工智能发展中的关键挑战，可能促使数据获取策略转变，并影响未来合理使用法律定义。

在人工智能和版权领域内，最近的法院文件揭示了脸书（Facebook）在为其人工智能模型提供数据方面的战略转变。这家科技巨头暂停了为人工智能训练数据获取图书许可的努力，这一举动对关于生成式人工智能时代合理使用和知识产权的持续辩论产生了重大影响。

脸书为何停止图书许可？这一披露出现在正在进行的版权诉讼中，即《卡德雷诉脸书平台》案，这强化了之前关于脸书已与图书出版商冷却谈判的传言。这场法律斗争只是人工智能公司与创作者之间更大战争中的一个小冲突，核心问题是：在受版权保护的材料上训练人工智能是否属于“合理使用”？尽管脸书等人工智能公司主张合理使用，但版权持有者强烈反对。新提交的法院文件，包括脸书员工的证词记录，表明了许可暂停的务实但略显令人担忧的原因。根据脸书的人工智能合作伙伴负责人西·乔杜里（Sy Choudhury）的说法，与出版商联系进行图书许可的努力遭遇了意想不到的冷遇。以下是脸书报告面临的挑战：

– **缓慢的出版商参与**：脸书尝试联系大量顶级出版商以获取生成式人工智能训练数据，但收到的回应很少。许多“冷接触”未得到答复，表明出版行业缺乏最初的兴趣或可能的顾虑。
– **可扩展性问题**：即使有出版商参与，过程似乎也不可持续。与众多出版商就大量人工智能训练数据进行个别的许可谈判是一个后勤噩梦。
– **权利所有权问题**：在小说类别中出现了显著障碍。出版商经常发现他们实际上没有权利将内容许可给脸书，因为这些权利归属于个别作者。这使得需要与无数作者进行冗长的谈判。

“合理使用”辩护与版权诉讼

脸书在版权诉讼中的立场基于“合理使用”的原则，这是一种法律原则，在某些情况下允许在未经许可的情况下有限使用受版权保护的材料，如批评、评论、新闻报道、教学、学术研究和研究。人工智能公司认为其模型的训练属于研究和转化用途，因此符合合理使用的条件。然而，《卡德雷诉脸书平台》案的原告，如莎拉·西尔弗曼（Sarah Silverman）和塔-内希·科茨（Ta-Nehisi Coates），对此有着截然不同的看法。他们认为未经明确许可和补偿而使用其受版权保护的书籍来训练商业人工智能模型明显违反了版权法。他们声称人工智能公司从他们的创意作品中获利而没有适当的归属或报酬。

阴影图书馆和磁力链接：人工智能训练数据的阴暗面？

版权诉讼中的修订投诉又提出了一个严重的指控：脸书据称使用“阴影图书馆”——实质上是盗版电子书的集合——来训练其生成式人工智能模型，包括流行的Llama系列。投诉还暗示脸书可能使用磁力链接访问这些非法图书馆。磁力链接是一种点对点文件共享方法，要求用户不仅下载文件还要“播种”（上传）文件。原告认为这种播种过程构成了版权侵权，进一步复杂化了脸书的法律地位。

超越书籍：脸书更广泛的人工智能训练数据策略

有趣的是，法院记录显示这不是脸书第一次暂停与人工智能训练数据相关的许可努力。乔杜里提到了类似的经验，即从游戏引擎和游戏制造商那里获取3D世界的许可用于人工智能研究。面对类似的参与挑战，脸书选择在这个领域开发自己的解决方案。这表明一种模式：当许可证明过于困难或缓慢时，脸书似乎倾向于探索替代的内部方法来获取人工智能训练数据。

这对人工智能和版权的未来意味着什么？

脸书暂停图书许可的努力和正在进行的版权诉讼突显了人工智能发展的关键节点。该行业正在努力解决数据来源、知识产权权利以及在大量受版权保护的材料上训练人工智能模型的伦理影响等基本问题。我们可以从中推断出以下几点：

– **对人工智能训练数据的审查增加**：法律挑战迫使人工智能公司重新评估其数据获取策略，并考虑使用受版权保护的材料而未经明确同意可能带来的潜在法律和声誉风险。
– **向开放和公共领域数据的潜在转变**：如果许可受版权保护的材料变得过于复杂或法律风险过高，人工智能开发者可能会越来越多地转向公开可用的数据或探索合成数据生成的方法。
– **“合理使用”定义的演变**：这些诉讼最终可能塑造人工智能训练背景下的“合理使用”法律定义，为未来的人工智能发展和版权法设定先例。
– **内容创作者的不确定性**：作者和其他创作者处于不确定状态，寻求对其作品在快速扩展的人工智能景观中使用的清晰性和公平补偿。情况仍然不稳定，针对脸书的版权诉讼及其类似案件的结果无疑将对人工智能公司在生成式人工智能训练及其与版权持有者关系方面的方式产生深远影响。脸书暂停图书许可可能是暂时的挫折，也可能是随着这家科技巨头在复杂的法律和道德水域中航行而发生的更根本的战略转变。

(以上内容均由Ai生成)