揭秘:Meta 令人震惊地暂停 AI 训练数据的书籍许可

发布时间:2025年2月18日    来源:szf
揭秘:Meta 令人震惊地暂停 AI 训练数据的书籍许可

快速阅读: 《比特币世界》消息,脸书暂停了为人工智能训练获取图书许可的努力,此举引发关于生成式人工智能时代合理使用和知识产权的辩论。脸书面临出版社冷淡回应、可扩展性问题及权利所有权障碍。同时,版权诉讼指责脸书使用“影子图书馆”训练AI。这反映了人工智能发展中的关键挑战,可能促使数据获取策略转变,并影响未来合理使用法律定义。

在人工智能和版权领域内,最近的法院文件揭示了脸书(Facebook)在为其人工智能模型提供数据方面的战略转变。这家科技巨头暂停了为人工智能训练数据获取图书许可的努力,这一举动对关于生成式人工智能时代合理使用和知识产权的持续辩论产生了重大影响。

脸书为何停止图书许可?这一披露出现在正在进行的版权诉讼中,即《卡德雷诉脸书平台》案,这强化了之前关于脸书已与图书出版商冷却谈判的传言。这场法律斗争只是人工智能公司与创作者之间更大战争中的一个小冲突,核心问题是:在受版权保护的材料上训练人工智能是否属于“合理使用”?尽管脸书等人工智能公司主张合理使用,但版权持有者强烈反对。新提交的法院文件,包括脸书员工的证词记录,表明了许可暂停的务实但略显令人担忧的原因。根据脸书的人工智能合作伙伴负责人西·乔杜里(Sy Choudhury)的说法,与出版商联系进行图书许可的努力遭遇了意想不到的冷遇。以下是脸书报告面临的挑战:

– **缓慢的出版商参与**:脸书尝试联系大量顶级出版商以获取生成式人工智能训练数据,但收到的回应很少。许多“冷接触”未得到答复,表明出版行业缺乏最初的兴趣或可能的顾虑。
– **可扩展性问题**:即使有出版商参与,过程似乎也不可持续。与众多出版商就大量人工智能训练数据进行个别的许可谈判是一个后勤噩梦。
– **权利所有权问题**:在小说类别中出现了显著障碍。出版商经常发现他们实际上没有权利将内容许可给脸书,因为这些权利归属于个别作者。这使得需要与无数作者进行冗长的谈判。

“合理使用”辩护与版权诉讼

脸书在版权诉讼中的立场基于“合理使用”的原则,这是一种法律原则,在某些情况下允许在未经许可的情况下有限使用受版权保护的材料,如批评、评论、新闻报道、教学、学术研究和研究。人工智能公司认为其模型的训练属于研究和转化用途,因此符合合理使用的条件。然而,《卡德雷诉脸书平台》案的原告,如莎拉·西尔弗曼(Sarah Silverman)和塔-内希·科茨(Ta-Nehisi Coates),对此有着截然不同的看法。他们认为未经明确许可和补偿而使用其受版权保护的书籍来训练商业人工智能模型明显违反了版权法。他们声称人工智能公司从他们的创意作品中获利而没有适当的归属或报酬。

阴影图书馆和磁力链接:人工智能训练数据的阴暗面?

版权诉讼中的修订投诉又提出了一个严重的指控:脸书据称使用“阴影图书馆”——实质上是盗版电子书的集合——来训练其生成式人工智能模型,包括流行的Llama系列。投诉还暗示脸书可能使用磁力链接访问这些非法图书馆。磁力链接是一种点对点文件共享方法,要求用户不仅下载文件还要“播种”(上传)文件。原告认为这种播种过程构成了版权侵权,进一步复杂化了脸书的法律地位。

超越书籍:脸书更广泛的人工智能训练数据策略

有趣的是,法院记录显示这不是脸书第一次暂停与人工智能训练数据相关的许可努力。乔杜里提到了类似的经验,即从游戏引擎和游戏制造商那里获取3D世界的许可用于人工智能研究。面对类似的参与挑战,脸书选择在这个领域开发自己的解决方案。这表明一种模式:当许可证明过于困难或缓慢时,脸书似乎倾向于探索替代的内部方法来获取人工智能训练数据。

这对人工智能和版权的未来意味着什么?

脸书暂停图书许可的努力和正在进行的版权诉讼突显了人工智能发展的关键节点。该行业正在努力解决数据来源、知识产权权利以及在大量受版权保护的材料上训练人工智能模型的伦理影响等基本问题。我们可以从中推断出以下几点:

– **对人工智能训练数据的审查增加**:法律挑战迫使人工智能公司重新评估其数据获取策略,并考虑使用受版权保护的材料而未经明确同意可能带来的潜在法律和声誉风险。
– **向开放和公共领域数据的潜在转变**:如果许可受版权保护的材料变得过于复杂或法律风险过高,人工智能开发者可能会越来越多地转向公开可用的数据或探索合成数据生成的方法。
– **“合理使用”定义的演变**:这些诉讼最终可能塑造人工智能训练背景下的“合理使用”法律定义,为未来的人工智能发展和版权法设定先例。
– **内容创作者的不确定性**:作者和其他创作者处于不确定状态,寻求对其作品在快速扩展的人工智能景观中使用的清晰性和公平补偿。情况仍然不稳定,针对脸书的版权诉讼及其类似案件的结果无疑将对人工智能公司在生成式人工智能训练及其与版权持有者关系方面的方式产生深远影响。脸书暂停图书许可可能是暂时的挫折,也可能是随着这家科技巨头在复杂的法律和道德水域中航行而发生的更根本的战略转变。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日