AI

Perplexity涉嫌秘密抓取禁用网站内容

发布时间:2025年8月5日    来源:szf
Perplexity涉嫌秘密抓取禁用网站内容

快速阅读: 互联网基础设施提供商 Cloudflare 指控人工智能公司 Perplexity 忽视网站阻止指令,通过更改用户代理和网络标识绕过限制,Cloudflare 移除其验证并推出市场允许网站向 AI 爬虫收费。

互联网基础设施提供商 Cloudflare 发布最新研究报告,指控人工智能初创公司 Perplexity 在抓取网站内容时忽视了明确的阻止指令。Cloudflare 观察到 Perplexity 尝试抓取网页时隐藏自己的身份,以此规避网站的偏好设置。

Perplexity 等人工智能产品通常依赖从互联网收集大量数据,这些初创公司长期以来在未获许可的情况下抓取文本、图像和视频,以支持其产品的正常运作。近年来,许多网站通过使用标准的 Robots.txt 文件来应对这一问题,该文件指示搜索引擎和 AI 公司哪些页面可以被索引,哪些页面不可以。然而,当前这些努力的成效并不显著。

根据 Cloudflare 的分析,Perplexity 似乎通过更改其机器人的“用户代理”来绕过这些限制。“用户代理”是指用于识别网站访问者的设备和版本类型的信号。Cloudflare 还提到,Perplexity 更改了其自治系统网络(ASN),这是一个识别互联网上大型网络的数字标识。Cloudflare 在数万个域名和数百万个请求中观察到了这一行为,凭借机器学习和网络信号的结合成功识别了这一爬虫。

Perplexity 的发言人 Jesse Dwyer 对 Cloudflare 的指控表示反驳,称其博客文章为“推销”。他补充说,文中截图显示没有访问内容。他还声称,Cloudflare 所提到的爬虫并非其所拥有。Cloudflare 表示,他们最初注意到这些问题是因为客户投诉 Perplexity 仍在抓取其网站内容,尽管这些网站已通过 Robots 文件阻止了该爬虫的访问。

Cloudflare 的分析表明,Perplexity 不仅使用了其声明的用户代理,还在其被阻止时利用一个模拟 Google Chrome 的通用浏览器。最终,Cloudflare 决定将 Perplexity 的爬虫从其验证列表中移除,并采取新的技术来阻止其活动。

值得注意的是,Cloudflare 最近对人工智能爬虫表示反对,并推出了一个市场,允许网站所有者向访问其网站的 AI 爬虫收费。Cloudflare 的首席执行官马修·普林斯曾警告称,人工智能正在破坏互联网的商业模式,尤其是出版商的盈利模式。这并非 Perplexity 第一次面临未经授权抓取的指控,早在去年,《连线》杂志等媒体就曾指控 Perplexity 抄袭其内容。

划重点:

– Cloudflare 指控 Perplexity 在抓取内容时忽视网站的阻止指令。

– Perplexity 通过更改用户代理和网络标识试图绕过网站保护措施。

– Cloudflare 推出市场允许网站向 AI 爬虫收费,以保护网站内容。

(以上内容均由Ai生成)

你可能还想读

openEuler发布首款SuperPoD就绪操作系统

openEuler发布首款SuperPoD就绪操作系统

快速阅读: 据最新消息,openEuler峰会2025在京举行,发布面向AI集群的24.03 LTS SP3版本及全栈AI方案,AMD等加入社区,全球三大芯片厂商齐聚,推动开源操作系统在多领域部署超1600万套。 11月14日至15日,操作 […]

发布时间:2025年12月10日
Netcall收购Jadu强化AI与数字能力

Netcall收购Jadu强化AI与数字能力

快速阅读: 12月10日消息,Netcall公司近日收购英国数字体验平台Jadu Holdings Limited,旨在增强其Liberty平台的数字化与AI能力,拓展英国地方政府及美国等国际市场,提升盈利与财务稳定性。 英国数字体验平台提 […]

发布时间:2025年12月10日
Pine Labs推印度首个AI账单支付助手

Pine Labs推印度首个AI账单支付助手

快速阅读: 最新消息显示,Pine Labs旗下Setu推出印度首个智能代理账单支付服务,可自动抓取账单、识别异常费用并在用户设定限额内完成支付,目前已上线Claude和ChatGPT平台。 12月10日,Pine Labs旗下API驱动平 […]

发布时间:2025年12月10日
IBM豪掷110亿美元收购Confluent加码AI数据流

IBM豪掷110亿美元收购Confluent加码AI数据流

快速阅读: 12月10日消息,IBM以110亿美元收购Confluent,获得Apache Kafka商业平台控制权,补足实时数据传输能力,结合红帽与HashiCorp技术,构建覆盖混合云环境的完整AI中间件体系。 国际商业机器公司(IBM […]

发布时间:2025年12月10日
2026年软件工程将全面迈入AI原生时代

2026年软件工程将全面迈入AI原生时代

快速阅读: 据媒体报道,荷兰科技企业Xebia推出AI原生工程平台ACE,可自动化50%至60%开发流程,提升交付速度40%、现代化效率70%,推动软件工程全面智能化转型。 随着人工智能技术加速演进,软件工程正迈向“AI原生”新阶段。业界观 […]

发布时间:2025年12月10日
微软宣布175亿美元投资印度AI基建

微软宣布175亿美元投资印度AI基建

快速阅读: 消息人士透露,微软宣布投资175亿美元支持印度AI基础设施建设,系其亚洲最大单笔投资,将分四年推进海得拉巴云区域等项目,助力构建“AI优先”生态体系。 微软公司近日宣布计划投资175亿美元,用于支持印度人工智能基础设施建设。该公 […]

发布时间:2025年12月10日
卡塔尔MCIT签约多家科技巨头推进AI政务转型

卡塔尔MCIT签约多家科技巨头推进AI政务转型

快速阅读: 据了解,卡塔尔通信和信息技术部与Malomatia、谷歌云、微软等六家企业签署战略合作协议,纳入GovAI计划,推动政府AI应用及数字项目建设,助力实现2030国家愿景。 卡塔尔通信和信息技术部近日宣布,与多家本地及国际科技企业 […]

发布时间:2025年12月10日
沃达丰卡塔尔高管开讲AI与网络安全

沃达丰卡塔尔高管开讲AI与网络安全

快速阅读: 据了解,沃达丰卡塔尔首席技术官博克托在巴尔赞大学学院讲座中指出,AI驱动的网络攻击正重塑安全威胁格局,运营商需借力机器学习与预测分析提升防御韧性,并加强产学研合作以支撑卡塔尔国家愿景2030。 近日,沃达丰卡塔尔公司首席技术官拉 […]

发布时间:2025年12月10日