人工智能在实验室任务中超越病毒学家,引发了对生物武器安全的担忧

发布时间:2025年4月26日    来源:szf
人工智能在实验室任务中超越病毒学家,引发了对生物武器安全的担忧

快速阅读: 据《eWeek 系列》称,新研究显示AI在病毒学任务中超越专家,引发更快突破的希望及生物武器风险担忧。麻省理工等机构测试了多个AI模型,发现有网路访问的专家平均得分22.1%,而OpenAI的o3模型得分43.8%。研究人员呼吁谨慎访问控制,xAI提出风险管理框架应对潜在威胁。

图片来源:DC_工作室/Envato元素
eWEEK的内容和产品推荐保持独立编辑立场。当您点击我们的合作伙伴链接时,我们可能会赚钱。了解更多。

一项新研究显示,在专业实验室任务中,人工智能的表现超过了专家病毒学家,这引发了对更快的生物医学突破的希望,同时也引发了对生物武器风险的担忧。

研究人员测试了领先的AI模型——如OpenAI的GPT-4o、谷歌的Gemini 2.5 Pro、Anthropic的Claude 3.5 Sonnet以及DeepSeek的R1——与病毒学能力测试(Virology Capabilities Test,简称VCT)进行对比。VCT是一个旨在评估病毒学和湿实验室协议专家级知识的基准。结果显示,像OpenAI的GPT-4o这类AI模型在准确性上超过了大多数人类病毒学家。

研究中提到:“VCT包含322个多模态问题,涵盖了病毒学实验室实际工作所需的基本、隐性和视觉知识。”

拥有或正在攻读病毒学博士学位的科学家使用由OpenAI、谷歌、Anthropic和DeepSeek开发的大语言模型(LLMs)测试了VCT问题。VCT使用的基准问题分为四个类别:重要、困难、验证和多模态。

“重要”类别的问题测试了受试者在病毒学领域的基础知识,这是胜任实验室研究员所需的理解水平。

“困难”类别的问题要求更深层次的知识或领域专长。

“验证”类别中的问题是经过专家审核和验证的答案。

“多模态”问题包含了反映真实实验室场景的图片。

这项研究是在麻省理工学院媒体实验室、巴西UFABC大学和SecureBio中心进行的。

病毒学基准与大语言模型对比研究的结果

结果显示,有互联网访问权限的专家在VCT测试中平均得分22.1%,但AI模型表现更高。

OpenAI的o3模型得分43.8%,优于94%被要求回答特定专业问题的专家病毒学家。

DeepSeek-R1模型得分为38.6%。

谷歌的Gemini 2.5 Pro模型得分为37.6%。

OpenAI的o4-mini模型得分为37%,其早期版本GPT-4模型得分为35.4%。

Anthropic(2024年10月发布)的Claude 3.5 Sonnet模型得分为33.6%。

基于调查结果的安全隐患

研究人员表示:“VCT的结果强调了亟需审慎的访问控制,以平衡有益的研究与安全顾虑。”

甚至更具风险的是能够独立执行任务的AI病毒学家聊天机器人。如果落入不法分子手中,这些AI模型可能被用于制造可能导致大规模破坏的生物武器。

尽管AI提高了效率并增加了准确性,但科学家们警告其潜在危险。虽然科学家可以利用AI预防传染病的大规模爆发,但在非专家手中,AI模型可能被武器化,用于制造和生产生物武器。

“之前我们发现这些模型有很多理论知识,但缺乏实践知识,”AI安全中心主任丹·亨德里克斯在接受《时代》杂志采访时说。“但现在它们获得了令人担忧的大量实践知识。”

“我们希望给予那些有正当理由询问如何操控致命病毒的人——例如麻省理工学院生物学系的研究人员——这样的能力……但刚注册的普通用户不具备这种能力,”亨德里克斯补充道。

风险管理框架的回应

针对研究人员的发现,xAI为Grok模型发布了一个风险管理框架。xAI概述了诸如训练AI模型拒绝有害请求、设置有害输出的断路器以及过滤与网络犯罪和大规模杀伤性武器相关的查询等保障措施。

(以上内容均由Ai生成)

你可能还想读

韩国首秀高超音速导弹,强化区域威慑能力

韩国首秀高超音速导弹,强化区域威慑能力

快速阅读: 韩国研发高超音速空地导弹HAGM,长4.1米,直径0.6米,重220公斤,速度马赫5至10,射程500至1000公里,计划由KF-21战斗机发射,标志韩国防御能力重大提升。 新研发的韩国高超音速空地导弹(HAGM)长度为4.1米 […]

发布时间:2025年10月23日
美公司推出X-Bat喷气垂直起降战斗无人机

美公司推出X-Bat喷气垂直起降战斗无人机

快速阅读: 美国公司Shield AI推出火箭/喷气推进的X-Bat无人机,具备垂直起降能力和远程作战能力,计划2026年首飞,2028年投入实战,可能吸引乌克兰兴趣。 美国公司Shield AI以其V-Bat垂直起降侦察无人机而闻名,该无 […]

发布时间:2025年10月23日
俄防空击落14无人机,里亚赞油厂遭袭起火

俄防空击落14无人机,里亚赞油厂遭袭起火

快速阅读: 俄罗斯防空部队摧毁14架无人机,Ryazan州长确认,其中一架无人机碎片坠落引发企业火灾,事件初期官方未作评论。 起初,当地官员未对此事件发表评论,但随后俄罗斯媒体和Telegram上的公众账号发布了 Ryazan 州长的声明。 […]

发布时间:2025年10月23日
无人机革命:欧美军备竞赛新焦点

无人机革命:欧美军备竞赛新焦点

快速阅读: 美国陆军协会展览上,无人机成焦点,反映军事革命。欧洲面临安全挑战与工业机遇,正调整防务策略。无人机技术轻量化、低成本,推动美欧军事转型。 在最近于华盛顿举行的美国陆军协会展览上,无人机成为了主角,这反映了过去三年半乌克兰战争中发 […]

发布时间:2025年10月23日
苏丹快速支援部队连续三天对喀土穆机场发动无人机袭击

苏丹快速支援部队连续三天对喀土穆机场发动无人机袭击

快速阅读: 准军事快速支援部队(RSF)周四对苏丹喀土穆国际机场连续第三天实施无人机袭击,七架无人机攻击机场及周边,引发恐慌与爆炸声。尽管袭击频繁,安全消息指机场未受重大损害。 准军事快速支援部队(RSF)周四对苏丹首都喀土穆国际机场进行了 […]

发布时间:2025年10月23日
北方司令部多域演习提升未来战争准备度

北方司令部多域演习提升未来战争准备度

快速阅读: 北方司令部组织为期四天的三军多域演习,测试网络、太空等多领域能力,提升印度未来战争准备水平,强化国家整体协作。 近日,北方司令部组织了一场为期四天的三军多域演习,旨在提高印度对未来战争的准备水平。演习设计模拟了激烈的未来冲突场景 […]

发布时间:2025年10月23日
美空军选Aechelon强化模拟训练系统

美空军选Aechelon强化模拟训练系统

快速阅读: Aechelon Technology 被选为美国空军SCARS项目供应商,提供OGC通用数据库,增强模拟训练环境的互操作性和成本效益。项目包括AI驱动的地球数字孪生Project Orbion,支持多领域国防需求。 Aeche […]

发布时间:2025年10月23日
德军将与英军合作搜寻俄罗斯潜艇

德军将与英军合作搜寻俄罗斯潜艇

快速阅读: 英德两国加强网络和军事合作,新成立的网络与特种作战指挥部将共享数据、情报及操作工具,共同开发安全云网络,实现信息实时共享与防御网络攻击。 这一新进展意味着两国将加强网络和军事合作。英国新成立的网络与特种作战指挥部与德国的网络与信 […]

发布时间:2025年10月23日