一家公司阻止 AI 网络爬虫窃取您的内容的狡猾计划

发布时间:2025年3月24日    来源:szf
一家公司阻止 AI 网络爬虫窃取您的内容的狡猾计划

快速阅读: 据《可混搭》称,Cloudflare推出新计划“人工智能迷宫”,通过设置虚假网页诱捕违规AI爬虫,防止未经授权的数据抓取,保护网站内容,同时避免影响人类用户。

人工智能正在窃取你的内容数据。我们知道,这是人工智能公司建立其高价值业务的方式——通过抓取网络并使用你的数据来训练他们的聊天机器人。网络爬虫并非新鲜事。在过去,网站可以依靠简单的协议,如`robots.txt`文件,来定义网络爬虫可以或不可以使用的资源。这些指导方针曾被从事爬取工作的公司所遵守,例如用于构建搜索引擎的结果。

然而,人工智能公司无视这些指示,没有遵守这一社会契约。Cloudflare,一个帮助世界上一些最大型网站向用户交付内容的全球网络服务提供商,已经制定了一项新的计划来应对人工智能公司的网络爬虫。这个想法既巧妙又富有创意。

在一篇新的博客文章中,Cloudflare 分享了它如何“诱捕违规机器人进入人工智能迷宫”。基本上,那些不遵循通过诸如`robots.txt`等协议为其设定规则的机器人——这是一种简单的文本文件,规定了网络爬虫可以在站点上做什么——会被干扰,从而浪费负责管理这些机器人的公司的时间和资源。

Cloudflare 表示:“人工智能生成的内容呈爆炸式增长……与此同时,我们也看到了人工智能公司用于模型训练的数据爬取工具数量的激增。” “人工智能爬虫每天向我们的 Cloudflare 网络发出超过 500 亿个请求,占我们观察到的所有网页请求不到 1%。”

Cloudflare 表示,它之前只是简单地阻止人工智能网络爬虫和抓取工具。然而,这样做会让背后操控者意识到它们的访问被拒绝了,结果它们会改变策略以继续其抓取活动。因此,Cloudflare 想出了一个设下陷阱的策略:一系列由人工智能生成内容创建的虚假网页。

Cloudflare 表示,它之前只是简单地阻止人工智能网络爬虫和抓取工具。然而,这样做会让背后操控者意识到它们的访问被拒绝了,结果它们会改变策略以继续其抓取活动。Cloudflare 利用人工智能生成的内容来对抗人工智能爬虫,这不仅仅是为了报复。当人工智能基于人工智能生成的内容进行训练时,实际上会损害人工智能模型本身。行业内甚至为此创造了一个术语:“模型崩溃”。

Cloudflare 实质上是在确保违规机器人因违反规则而受到惩罚。

Cloudflare 的帖子详细说明了构建人工智能迷宫的技术细节。但其主要思路是,Cloudflare 设计的一切方式都应确保人类访客不会看到这些由人工智能生成的陷阱页面。此外,人类会注意到这些页面上的“人工智能生成的胡言乱语”。然而,机器人会陷入兔子洞,随着它们深入多页人工智能生成的内容,浪费计算资源。

Cloudflare 的客户目前可以选择开启人工智能迷宫功能,以保护他们的内容免受网络爬虫的侵害。Cloudflare 的帖子详细说明了构建人工智能迷宫的技术细节。但其主要思路是,Cloudflare 设计的一切方式都应确保人类访客不会看到这些由人工智能生成的陷阱页面。此外,人类会注意到这些页面上的“人工智能生成的胡言乱语”。然而,机器人会陷入兔子洞,随着它们深入多页人工智能生成的内容,浪费计算资源。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日