作者聚焦 Meta 的 BitTorrent 窃取活动

发布时间:2025年3月12日    来源:szf
作者聚焦 Meta 的 BitTorrent 窃取活动

快速阅读: 据《洪流怪》最新报道,在针对Meta使用受版权保护内容训练大型语言模型的集体诉讼中,联邦法院法官驳回了Meta关于加州计算机数据访问和欺诈法案(CDAFA)的违规行为指控,但保留了关于删除版权管理信息(CMI)的指控。Meta被指通过BitTorrent与第三方共享盗版书籍,作者认为这构成直接版权侵权。法官允许作者进行额外调查,以支持核心版权侵权指控。案件焦点转向Meta是否通过BitTorrent传播盗版书籍,以及这是否属于合理使用。

在构建最强大的大型语言模型(LLM)的竞争中,多家科技公司未经版权所有者的许可,使用了受版权保护的内容作为训练数据。Meta是众多因这一涉嫌侵权行为而被起诉的公司之一,包括理查德·卡德雷、莎拉·西尔弗曼和克里斯托弗·戈尔登等作者提起的集体诉讼。此案显然涉及盗版问题,因为Meta使用了盗版书籍库作为训练材料。Meta承认了它早期使用了这些非官方来源。然而,与此同时,该公司否认了侵犯版权的指控,并指出它将依赖合理使用辩护,至少部分如此。诉讼形成在今年早些时候,Meta试图缩小法律斗争的范围,请求法院驳回三项主要指控中的两项。Meta辩称,根据《加利福尼亚综合计算机数据访问和欺诈法案》(CDAFA)所提出的违规行为站不住脚。同样的情况也适用于Meta删除版权管理信息(CMI)的指控,这将违反《数字千年版权法》(DMCA)。CMI是指包含在受版权保护作品中的信息,其中包括识别版权持有者等内容。值得注意的是,Meta并未请求驳回核心版权侵权投诉。相反,它表示有信心通过简易判决“驳倒这一无根据的指控”。

上周晚些时候,联邦法院法官文斯·乔布里(Vince Chhabria)在判决书中写道,驳回了CDAFA指控,正如Meta所要求的那样。然而,删除CMI的指控在驳回动议中幸存下来。尽管法官并不认为剥离受版权保护的数据会改善训练材料,但Meta可能已经删除了这些数据以掩盖其所谓的侵权行为。“原告充分指控Meta故意删除CMI以掩盖版权侵权。原告声称,除非从训练数据中移除CMI,否则Meta‘知道Llama特别容易记住并生成CMI输出’,”乔布里法官在判决书中写道。因此,案件将继续进行,删除CMI的指控仍然存在。

然而,在更广泛的角度下,主要的版权侵权指控很可能是争议最大的问题。这使得焦点逐渐从Meta使用书籍作为训练数据转移到了通过BitTorrent与第三方共享这些书籍上。作者请求部分简易判决周一,在一份大量删减的文件中,作者们申请简易判决。他们请求法院裁定Meta通过BitTorrent从盗版图书馆获取盗版书籍,直接侵犯了版权。作者们认为,现有的证据,包括Meta员工的陈述,清楚地表明该公司盗取了数百万受版权保护的作品。原告方指出,这里不存在合理使用的辩护,因为法院此前曾裁定这种“无限制的盗版行为”不符合合理使用的条件。Meta可能会辩称使用盗版书籍作为人工智能训练数据符合合理使用原则。然而,作者们指出,这家科技公司与其他BitTorrent用户分享盗版书籍的行为,这是典型的种子传播方式,显然是侵权行为。“即使法院决定合理使用分析适用于Meta的无限制盗版行为以及通过种子传播获取原告版权作品的盗版副本,法院仍应根据四个合理使用因素裁定原告胜诉,即Meta决定向其他点对点海盗提供数百万受版权保护的书籍以换取更快的下载速度。”

这个“与他人共享”的元素是作者证据收集过程的核心,其中关于通过BitTorrent上传盗版书籍的指控受到了相当大的关注。“吸血鬼行为”理论上周同一天,当乔布里法官对部分驳回动议作出裁决时,他还对作者请求进行额外调查以支持其核心版权侵权指控作出了裁决。作者先前指控Meta在通过BitTorrent下载影子图书馆数据时与第三方共享了盗版书籍的副本。Meta对此回应说,它避免了任何海盗图书馆数据的播种,但这并没有阻止作者继续挖掘。由于“播种”通常指的是BitTorrent用户拥有完整下载文件的状态,版权所有者开始对Meta的“吸血鬼行为”活动感兴趣。吸血鬼行为是指尚未完成整个种子下载的状态。然而,由于BitTorrent协议的性质,吸血者仍可能上传他们已有的文件片段给同一群中的其他用户。作者怀疑Meta可能已经这么做了。额外调查包括“吸血鬼行为”这一术语以及其他许多与种子相关的请求,作者希望从中找到确凿证据。

新的战场?虽然本案最初指控Meta使用受版权保护的书籍作为训练数据,但种子传播活动的重要性继续增加。从版权所有者的角度来看,这有可能识别直接侵权行为,而这种行为不太可能受到合理使用的保护。然而,Meta似乎越来越对案件的新发展感到沮丧。在其回应中,它请求法院限制有关“全新吸血鬼行为理论”的调查,理由是该理论之前未被提及。“原告不应被允许引入一位全新的专家及其报告,讨论一个新发现的主题‘吸血鬼行为’——这个词在2025年2月的生产或原告第三次修正诉状中都找不到。”Meta提到的专家是乔夫尼斯博士,在一份密封的专家报告中,他可能详细阐述了BitTorrent及相关术语的复杂性。作者还请求Meta提供更多文件和信息。这包括种子客户端的安装、使用和配置日志。值得注意的是,这一请求明确区分了播种和吸血阶段。在听取双方意见后,乔布里法官允许作者进行额外调查。结合昨天的简易判决动议,很明显随着案件的发展,Meta的吸血行为将继续成为关注的焦点。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日