专家揭示数百项 AI 安全测试存在严重缺陷

发布时间:2025年11月4日    来源:szf
专家揭示数百项 AI 安全测试存在严重缺陷

快速阅读: 英国政府AI安全研究所和多所大学研究发现,当前440多个AI模型安全性测试普遍存在缺陷,影响评估准确性。谷歌因Gemma模型虚构不实指控撤回AI,研究呼吁建立共享标准。

根据 最新 报道,来自英国政府 AI 安全研究所和多所知名大学的计算机科学家们发现,当前用于评估新一代人工智能(AI)模型安全性和有效性的测试存在广泛的缺陷。这项研究分析了超过440个基准测试,发现几乎所有的测试在某个方面都有弱点,这些弱点可能会影响到最终结论的有效性。

图源备注:图片由AI生成 研究的主要作者、牛津互联网研究所的研究员安德鲁・比恩(Andrew Bean)表示,这些基准测试是检查新发布 AI 模型安全性和是否符合人类利益的重要工具。然而,由于缺乏统一的标准和可靠的测量方法,很难判断这些模型是否真正取得了进展,或者只是表面上看起来在进步。

在目前英国和美国尚未出台全国性 AI 监管法规的背景下,基准测试成了技术公司推出新 AI 时的安 全网 。近期,一些公司因其 AI 模型造成的危害而不得不收回或收紧其产品。例如,谷歌最近撤回了一款名为 Gemma 的 AI,因为该模型虚构了关于一位美国参议员的不实指控,这引发了广泛的争议。

谷歌表示,Gemma 模型是为 AI 开发者和研究人员设计的,而不是供普通消费者使用,并在得知非开发者尝试使用后将其撤回。研究还发现,许多基准测试并未使用不确定性估计或统计测试,仅有16% 的测试具备这样的措施。此外,在评估 AI 的 “无害性” 等特征时,相关定义往往存在争议或模糊,进一步降低了基准测试的实用性。

该研究呼吁建立共享标准和 最佳 实践,以提升 AI 安全性和有效性的评估能力。

划重点: 🔍 近440个 AI 安全测试发现几乎所有都有缺陷,影响结论有效性。

🚫 谷歌因 Gemma 模型引发虚假指控事件,撤回该 AI。

📊 仅16% 的测试使用统计方法,亟需建立共享标准与 最佳 实践。

(以上内容均由Ai生成)

关键词: AI安全测试缺陷

你可能还想读

AI摄影新趋势:普通车照变专业级长曝光大片

AI摄影新趋势:普通车照变专业级长曝光大片

快速阅读: 新的AI摄影提示在社交媒体上流行,将普通汽车照片转化为长曝光效果,如同高端佳能单反所摄,带来电影般的光泽和专业照明,无需摄影设备,效果逼真,深受用户喜爱。 一种新的AI摄影提示正在社交媒体上风靡一时,它将普通的汽车照片转化为令人 […]

发布时间:2025年11月4日
帕拉迪恩AI获美国专利,实现异构群智能协作

帕拉迪恩AI获美国专利,实现异构群智能协作

快速阅读: 帕拉迪恩人工智能获美国专利12,452,957 B2,实现异构传感器网络的闭环任务分配与控制,支持多类型自主系统高效协作,即使在受限环境中也能提供稳健性能。 帕拉迪恩人工智能公司(纳斯达克股票代码:PDYN 和 PDYNW)今日 […]

发布时间:2025年11月4日
AI加速加密骗局,行业需构建内置韧性

AI加速加密骗局,行业需构建内置韧性

快速阅读: 丹诺·科恩指出2025年加密货币面临重大风险,AI加速诈骗,去年欺诈损失达99亿美元,需从修补转向内置韧性,加强实时防御。 丹诺·科恩,Kerberus的联合创始人兼首席技术官发表观点称,2025年加密货币风险如同洪流般涌现。人 […]

发布时间:2025年11月4日
亚马逊与OpenAI达成330亿欧元云服务协议,股价创历史新高

亚马逊与OpenAI达成330亿欧元云服务协议,股价创历史新高

快速阅读: 亚马逊与OpenAI达成330亿欧元云计算协议,股价创历史新高,市值增至2.4万亿欧元。协议显示AWS计算能力获高度认可,助力OpenAI发展。 亚马逊股价在与OpenAI达成330亿欧元云计算协议后创历史新高,据雨果·邓肯报道 […]

发布时间:2025年11月4日
帕兰蒂尔市值激增160亿美元,AI热潮持续升温

帕兰蒂尔市值激增160亿美元,AI热潮持续升温

快速阅读: Palantir Technologies因强劲财报市值激增160亿美元至近5000亿美元,商业收入增长121%,超越政府业务,成企业AI基础设施领导者,但高估值引发谨慎。 华尔街对人工智能(AI)的热情丝毫未减,而Palant […]

发布时间:2025年11月4日
OpenAI与AWS签署380亿美元云计算协议

OpenAI与AWS签署380亿美元云计算协议

快速阅读: OpenAI与亚马逊AWS签署380亿美元协议,获数十万英伟达GPU及数千万CPU,支持AI发展,计划2026年前全面投入使用,加速AI生态系统建设。 OpenAI,ChatGPT的开发者,周一与亚马逊的AWS云计算部门签署了一 […]

发布时间:2025年11月4日
创企Quickads获170万美元融资,加速企业市场扩展

创企Quickads获170万美元融资,加速企业市场扩展

快速阅读: 生成式AI公司Quickads获170万美元融资,由Kae Capital领投,谷歌和Meta参与。公司将加速企业市场扩张,提供全栈内容及用户行为分析,旨在将营销科学化,提高效率。 生成式AI初创公司Quickads近日完成了由 […]

发布时间:2025年11月4日
认知公司部署Anthropic的Claude,加速企业AI应用

认知公司部署Anthropic的Claude,加速企业AI应用

快速阅读: 认知公司采用安斯帕姆的克劳德模型,助力企业AI大规模部署,计划覆盖35万员工,整合克劳德代码与Flowsource平台,加速软件开发和代码重构,推动AI系统与人协作,提升安全性与合规性。 认知公司(Cognizant)已采用安斯 […]

发布时间:2025年11月4日