​AI 安全性与有效性测试存在严重缺陷,引发专家关注

发布时间:2025年11月4日    来源:szf
​AI 安全性与有效性测试存在严重缺陷,引发专家关注

快速阅读: 英国政府AI安全研究所与多所大学专家研究发现,440多个AI测试基准普遍存在缺陷,影响结果有效性,呼吁制定共享标准。谷歌AI模型Gemma因传播虚假信息被撤回。

近日,来自英国政府 AI 安全研究所的计算机科学家及斯坦福大学、加州大学伯克利分校和牛津大学的专家们,对超过440个用于评估新人工智能模型安全性和有效性的基准进行了深入研究。他们发现几乎所有测试在某一领域存在缺陷,这些缺陷可能会 “削弱结果声明的有效性”,并且一些测试的评分结果可能 “无关紧要甚至误导”。

图源备注:图片由AI生成 随着各大科技公司不断推出新 AI,公众对 AI 的安全性和有效性日益担忧。当前,美国和英国尚未实施全国范围的 AI 监管,而这些基准则成为检验新 AI 是否安全、是否符合人类利益及其在推理、数学和编码方面声称能力的重要工具。

研究的首席作者、牛津互联网研究所的 Andrew Bean 表示:“基准测试支撑着几乎所有关于 AI 进步的声明,但缺乏统一的定义和可靠的测量,使得我们难以判断模型是否真正改善,还是仅仅看似改善。” 他提到,谷歌最近撤回了其新推出的 AI 模型 Gemma,因为该模型传播了有关美国参议员的不实指控,且这些指控是完全虚构的。

这并不是个别现象。Character.ai 也在最近宣布禁止青少年与其 AI 聊天机器人进行开放式对话,原因是该公司卷入了几起青少年自杀的争议。研究显示,只有16% 的基准使用不确定性估计或统计测试来展示其准确性。在一些评估 AI 特性的基准中,像 “无害性” 这样的概念定义不清,导致测试效果不佳。

专家们呼吁制定共享标准和 最佳 实践,以改善 AI 的评估过程,从而确保其安全性与有效性。

划重点: 🌐 研究发现,440多个 AI 测试基准几乎都有缺陷,影响结果有效性。

🚨 谷歌的 Gemma 模型因传播虚假指控而被撤回,凸显 AI 监管的紧迫性。

📊 仅16% 的基准使用统计测试,缺乏标准化,亟需改进 AI 评估方法。

(以上内容均由Ai生成)

你可能还想读

谷歌AI概览影响搜索流量,IAC多元化策略应对挑战

谷歌AI概览影响搜索流量,IAC多元化策略应对挑战

快速阅读: 微软推出“单点付费”模式,与OpenAI的“无限量套餐”形成对比,承诺支付费用支持AI项目,构建双面内容市场补偿出版商。甘内特等成首批合作伙伴,尽管受谷歌AI影响,数字收入仍增长9%。 沃格尔将微软市场描述为一种“单点付费”模式 […]

发布时间:2025年11月5日
OpenAI推出IndQA,促进印度多语言AI发展

OpenAI推出IndQA,促进印度多语言AI发展

快速阅读: OpenAI推出IndQA,新评估基准聚焦印度文化与语言,涵盖12种语言及10个文化领域,由261位专家构建,旨在改善AI在非英语地区的性能与可访问性。 位于旧金山的人工智能研究与部署公司OpenAI,于本周二推出了IndQA, […]

发布时间:2025年11月5日
联想发布超轻AI眼镜V1,重量仅38克支持实时翻译

联想发布超轻AI眼镜V1,重量仅38克支持实时翻译

快速阅读: 联想推出AI眼镜V1,重量38克,配备2000尼特显示器,支持提词器和智能戒指配对,提供手势控制。电池续航10小时,内置天曦AI助手,支持语音命令和实时翻译,售价3999元,旨在提高生产力。 联想新推出的AI眼镜V1重量仅为38 […]

发布时间:2025年11月5日
gartner发布2026年技术趋势:AI助力开发加速

gartner发布2026年技术趋势:AI助力开发加速

快速阅读: AI-native开发平台通过生成式AI技术简化软件创建,使前线部署工程师能与领域专家合作,加速应用开发,提高组织开发效率。 AI-native开发平台利用生成式AI技术,使得软件的创建比以往更快捷简便。嵌入业务中的软件工程师, […]

发布时间:2025年11月5日
微软发现利用OpenAI API的新后门“SesameOp”

微软发现利用OpenAI API的新后门“SesameOp”

快速阅读: 微软DART团队发现威胁行为者利用OpenAI助手API部署名为SesameOp的隐蔽后门,通过加密和压缩技术远程控制受感染设备,建议采取多项措施加强防护。 威胁行为者利用OpenAI助手应用程序编程接口(API)部署后门并远程 […]

发布时间:2025年11月5日
Railtown AI与TELUS合作,推动加拿大AI发展

Railtown AI与TELUS合作,推动加拿大AI发展

快速阅读: Railtown AI Technologies Inc.与TELUS合作,通过主权AI工厂为加拿大软件公司提供安全的国内AI计算能力,促进本地AI生态系统发展,减少对外部资源的依赖。TSE:RAIL股票获Spark中性评级,面 […]

发布时间:2025年11月5日
Gartner发布2026技术趋势,AI开发平台成焦点

Gartner发布2026技术趋势,AI开发平台成焦点

快速阅读: AI-native开发平台结合生成式AI技术,加速软件开发流程,简化开发复杂度。前线部署工程师与领域专家合作,提升应用开发效率,助力组织在现有规模下实现更多应用的快速开发。 AI-native开发平台利用生成式AI技术,使得软件 […]

发布时间:2025年11月5日
亚马逊推出Alexa+,提升音乐应用智能体验

亚马逊推出Alexa+,提升音乐应用智能体验

快速阅读: 亚马逊推出Alexa+,在iOS和Android版音乐应用中实现通过心情描述选择音乐的功能,需较新Echo设备支持,目前处于测试阶段,广受好评。 苹果智能技术的一大承诺是能够与我们的应用程序互动。未来,我们不仅可以通过简单的请求 […]

发布时间:2025年11月5日