揭秘:Meta 令人震惊地暂停 AI 训练数据的书籍许可

发布时间:2025年2月18日    来源:szf
揭秘:Meta 令人震惊地暂停 AI 训练数据的书籍许可

快速阅读: 《比特币世界》消息,脸书暂停了为人工智能训练获取图书许可的努力,此举引发关于生成式人工智能时代合理使用和知识产权的辩论。脸书面临出版社冷淡回应、可扩展性问题及权利所有权障碍。同时,版权诉讼指责脸书使用“影子图书馆”训练AI。这反映了人工智能发展中的关键挑战,可能促使数据获取策略转变,并影响未来合理使用法律定义。

在人工智能和版权领域内,最近的法院文件揭示了脸书(Facebook)在为其人工智能模型提供数据方面的战略转变。这家科技巨头暂停了为人工智能训练数据获取图书许可的努力,这一举动对关于生成式人工智能时代合理使用和知识产权的持续辩论产生了重大影响。

脸书为何停止图书许可?这一披露出现在正在进行的版权诉讼中,即《卡德雷诉脸书平台》案,这强化了之前关于脸书已与图书出版商冷却谈判的传言。这场法律斗争只是人工智能公司与创作者之间更大战争中的一个小冲突,核心问题是:在受版权保护的材料上训练人工智能是否属于“合理使用”?尽管脸书等人工智能公司主张合理使用,但版权持有者强烈反对。新提交的法院文件,包括脸书员工的证词记录,表明了许可暂停的务实但略显令人担忧的原因。根据脸书的人工智能合作伙伴负责人西·乔杜里(Sy Choudhury)的说法,与出版商联系进行图书许可的努力遭遇了意想不到的冷遇。以下是脸书报告面临的挑战:

– **缓慢的出版商参与**:脸书尝试联系大量顶级出版商以获取生成式人工智能训练数据,但收到的回应很少。许多“冷接触”未得到答复,表明出版行业缺乏最初的兴趣或可能的顾虑。
– **可扩展性问题**:即使有出版商参与,过程似乎也不可持续。与众多出版商就大量人工智能训练数据进行个别的许可谈判是一个后勤噩梦。
– **权利所有权问题**:在小说类别中出现了显著障碍。出版商经常发现他们实际上没有权利将内容许可给脸书,因为这些权利归属于个别作者。这使得需要与无数作者进行冗长的谈判。

“合理使用”辩护与版权诉讼

脸书在版权诉讼中的立场基于“合理使用”的原则,这是一种法律原则,在某些情况下允许在未经许可的情况下有限使用受版权保护的材料,如批评、评论、新闻报道、教学、学术研究和研究。人工智能公司认为其模型的训练属于研究和转化用途,因此符合合理使用的条件。然而,《卡德雷诉脸书平台》案的原告,如莎拉·西尔弗曼(Sarah Silverman)和塔-内希·科茨(Ta-Nehisi Coates),对此有着截然不同的看法。他们认为未经明确许可和补偿而使用其受版权保护的书籍来训练商业人工智能模型明显违反了版权法。他们声称人工智能公司从他们的创意作品中获利而没有适当的归属或报酬。

阴影图书馆和磁力链接:人工智能训练数据的阴暗面?

版权诉讼中的修订投诉又提出了一个严重的指控:脸书据称使用“阴影图书馆”——实质上是盗版电子书的集合——来训练其生成式人工智能模型,包括流行的Llama系列。投诉还暗示脸书可能使用磁力链接访问这些非法图书馆。磁力链接是一种点对点文件共享方法,要求用户不仅下载文件还要“播种”(上传)文件。原告认为这种播种过程构成了版权侵权,进一步复杂化了脸书的法律地位。

超越书籍:脸书更广泛的人工智能训练数据策略

有趣的是,法院记录显示这不是脸书第一次暂停与人工智能训练数据相关的许可努力。乔杜里提到了类似的经验,即从游戏引擎和游戏制造商那里获取3D世界的许可用于人工智能研究。面对类似的参与挑战,脸书选择在这个领域开发自己的解决方案。这表明一种模式:当许可证明过于困难或缓慢时,脸书似乎倾向于探索替代的内部方法来获取人工智能训练数据。

这对人工智能和版权的未来意味着什么?

脸书暂停图书许可的努力和正在进行的版权诉讼突显了人工智能发展的关键节点。该行业正在努力解决数据来源、知识产权权利以及在大量受版权保护的材料上训练人工智能模型的伦理影响等基本问题。我们可以从中推断出以下几点:

– **对人工智能训练数据的审查增加**:法律挑战迫使人工智能公司重新评估其数据获取策略,并考虑使用受版权保护的材料而未经明确同意可能带来的潜在法律和声誉风险。
– **向开放和公共领域数据的潜在转变**:如果许可受版权保护的材料变得过于复杂或法律风险过高,人工智能开发者可能会越来越多地转向公开可用的数据或探索合成数据生成的方法。
– **“合理使用”定义的演变**:这些诉讼最终可能塑造人工智能训练背景下的“合理使用”法律定义,为未来的人工智能发展和版权法设定先例。
– **内容创作者的不确定性**:作者和其他创作者处于不确定状态,寻求对其作品在快速扩展的人工智能景观中使用的清晰性和公平补偿。情况仍然不稳定,针对脸书的版权诉讼及其类似案件的结果无疑将对人工智能公司在生成式人工智能训练及其与版权持有者关系方面的方式产生深远影响。脸书暂停图书许可可能是暂时的挫折,也可能是随着这家科技巨头在复杂的法律和道德水域中航行而发生的更根本的战略转变。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日