Cloudflare 刚刚以迅雷钜万钧之势打击了 AI 网络爬虫:要么为内容付费,要么被阻止

发布时间:2025年7月11日    来源:szf
Cloudflare 刚刚以迅雷钜万钧之势打击了 AI 网络爬虫:要么为内容付费,要么被阻止

快速阅读: 据《观察家报》最新报道,一家大型科技公司Cloudflare宣布阻止AI爬虫未经许可抓取内容,引发关注。此举挑战了AI公司免费获取数据的模式,可能影响网络内容生态。

本月最大的新闻是,一家大型科技公司对人工智能行业宣战。7月1日,领先的网络安全和内容分发网络(CDN)提供商Cloudflare宣布了“内容独立日”。通过其服务器的互联网流量约占全球的五分之一,从那天起,AI网络爬虫——科技公司用来抓取在线内容的机器人——在没有向网站所有者支付补偿的情况下将无法访问运行在Cloudflare服务器上的网站。为什么这是一件大事?有几个原因。

首先,跨全球不同地点运行数据中心的CDN是互联网全球架构的重要组成部分。随着网络的发展,公司希望本地化提供内容——以减少延迟,比如传输中的延迟——但要在每个地区维护服务器既昂贵又物流复杂。让CDN托管并提供你的内容是一个不言而喻的选择。

其次,网站是脆弱的东西。如果你是一家大公司,你的网站会成为分布式拒绝服务(DDoS)攻击的目标,这些攻击旨在使它瘫痪,而CDN已经变得相当擅长抵御这些虚拟攻击。例如,两个月前,Cloudflare阻止了有史以来最大的DDoS攻击:每秒7.3太字节——相当于向一个客户网络中灌入超过9350部完整长度的高清电影——的攻击。对任何首席执行官来说,这个教训都很明确:如果你想晚上睡得好,就使用CDN。

近年来,一种新的针对在线托管内容的威胁出现了:网络爬虫。这些是由AI公司运行的互联网机器人,它们系统地浏览网络,收集可以找到的所有内容,用于训练生成式AI系统,如大型语言模型(LLM)。大多数情况下,这种搜集行为并未获得内容创作者或所有者的许可,并且被各种法律术语所合理化,比如“合理使用”等;或者用荒谬的论点来辩解,即如果创作者不喜欢他们的知识产权被随意夺取,他们总是可以选择退出。

所有这些解释了Cloudflare决定的重要性。现在,它默认阻止AI网络爬虫在未经许可或赔偿的情况下从其客户的网站上抓取内容。换句话说,它巧妙地逆转了AI巨头及其在英国和其他政府中的盟友的讽刺逻辑。以前是IP所有者必须选择退出被抢劫,现在则是袭击者必须礼貌地请求——也许还要付费。

或者正如《连线》的Steven Vaughan-Nichols所说:“代表其200多万客户,占网络20%的用户,Cloudflare现在阻止AI爬虫……此外,Cloudflare承诺通过行为分析和机器学习检测‘影子’爬虫——试图逃避检测的机器人。对鹅来说好的,对鸡来说也一样好。”

从公平的角度来看,这是个好消息,但在更广泛的背景下也很重要,因为现在显而易见的是,AI的开采正在迅速破坏网络的原始商业模式。在这个模式中,你创建了一个网站并发布了内容。搜索引擎随后索引整个网络,使你的网站可被找到。然后人们可以访问该网站,并通过这样做为你带来你希望从中获得的任何回报——无论是财务还是其他方面的。

然而,越来越多的人开始使用聊天机器人进行搜索,而不是传统的搜索引擎,如谷歌、必应等。他们不再获得一个可能与他们问题相关的网站列表,而是得到一个精心包装的答案。在某些情况下(比如像Perplexity这样的AI工具),机器人会提供它编译回复所引用的网站列表。但其他机器人似乎在研究方面不够谨慎。

所以看起来发生的事情是,LLM正迅速变成“答案机器”。这对用户来说显然很方便,但也意味着他们必须信任数据是从所使用的来源中提取的过程——并且它没有“幻觉”或编造内容。具有讽刺意味的是,这也可能导致聊天机器人所依赖的这些来源枯竭,因为事实证明,许多网站现在正受到骚扰性聊天机器人的困扰。

“AI热潮,”《连线》报道说,“催生了AI聚焦型网络爬虫的相应热潮,这些机器人以频率可以模仿DDoS攻击的方式抓取网页,使服务器承受压力并使网站下线。”

AI公司应该按次支付费用了。为Cloudflare欢呼!

(以上内容均由Ai生成)

你可能还想读

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

攻关 6G“拐点技术”:国星宇航 × 北京邮电大学共建语义卫星联合实验室

快速阅读: 国星宇航与北京邮电大学共建语义卫星联合实验室,聚焦语义卫星星座建设等关键技术,加速太空AI技术转化与应用落地,推动6G通信发展。 IT之家 10 月 22 日消息, 国星宇航今日宣布,将携手北京邮电大学共建语义卫星联合实验室 。 […]

发布时间:2025年10月23日
贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

贝索斯展望太空数据中心:利用恒定阳光解决AI能耗问题

快速阅读: 贝索斯提出在太空中建立数据中心的构想,利用不间断太阳能解决能源问题,但面临高昂的发射和维护成本及技术挑战。 贝索斯设想在地球大气层外利用持续阳光建立轨道数据中心。该计划承诺提供无限能源,不受云层和天气干扰的影响。然而,发射和维护 […]

发布时间:2025年10月11日
克瑞托斯庆祝Oriole火箭25年辉煌成就

克瑞托斯庆祝Oriole火箭25年辉煌成就

快速阅读: Kratos开发的Oriole火箭因2012年推出的TVC系统而性能大幅提升,完成多次高精度任务,支持全球多地点发射,助力高超音速研究,至今累计140次成功发射,确立行业领先地位。 Oriole的成功之旅因Kratos在2012 […]

发布时间:2025年10月11日
国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

国际首个,北邮第一代“卫星互联网防火墙”安全载荷成功发射

快速阅读: 北京邮电大学研发的“卫星互联网防火墙”安全载荷成功发射,实现物理层与网络层协同防护,具备10Gbps高并发流量检测能力,为卫星互联网安全提供重要保障。 感谢IT之家网友 tellMe 的线索投递! IT之家 9 月 19 日消息 […]

发布时间:2025年9月19日
ICEYE推出战术级太空情报系统ISR Cell

ICEYE推出战术级太空情报系统ISR Cell

快速阅读: ICEYE推出ISR Cell集装箱系统,使国防组织能现场获取近乎实时的太空ISR数据,加速高风险环境决策。系统已验证,提供更快、更可靠的情报,覆盖各决策层。预计2026年初交付,扩展军事客户基础。 美国加利福尼亚州洛杉矶(SP […]

发布时间:2025年9月13日
深学环形塑形技术助力天文观测,深化宇宙理解

深学环形塑形技术助力天文观测,深化宇宙理解

快速阅读: 科研团队开发的深度环路整形技术,显著提升了LIGO引力波观测站的控制精度和稳定性,降低了噪声水平,有助于天文学家更准确地研究宇宙动力学和形成过程,开启了下一代引力波科学的大门。 我们新开发的深度环路整形技术改进了引力波观测站的控 […]

发布时间:2025年9月5日
月球探索新突破!AI 助力撞击坑研究,效率提升惊人

月球探索新突破!AI 助力撞击坑研究,效率提升惊人

快速阅读: 中国科学院地球化学研究所发布“月球科学多模态专业大模型V2.0”,大幅提升月球地质研究效率,未来将向全球开放“数字月球”云平台。 在全球科技迅速发展的今天,中国科学家正借助人工智能的力量,推动月球科学研究的新进展。近日,在202 […]

发布时间:2025年9月1日
我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

我国风云卫星已与 17 个阿拉伯国家共享,推进多项气象合作

快速阅读: 中国将与阿联酋、约旦、埃及等国合作,共建气象卫星数据应用中心,研发灾害早期预警系统,开发气象人工智能模型,提升阿拉伯地区灾害性天气预报能力。 IT之家 8 月 29 日消息,据央视报道,我国将与阿联酋、约旦以及埃及等国家共同开展 […]

发布时间:2025年8月29日