英网络安全中心警示AI提示注入风险

发布时间:2025年12月9日    来源:szf
英网络安全中心警示AI提示注入风险

快速阅读: 据英国国家网络安全中心(NCSC)发布消息称,该机构警示大语言模型面临提示注入攻击风险,呼吁在AI系统设计初期纳入安全措施,并提出四项应对建议以降低供应链隐患。

日前,英国国家网络安全中心(NCSC)就大语言模型(LLM)面临的安全风险发出警示,指出提示注入攻击已成为AI系统的重要隐患,并呼吁相关方采取措施降低其在人工智能供应链中的影响。该机构强调,尽管彻底停用LLM已不现实,但设计者、开发者和运营方必须承认LLM“本质上易受混淆”,并在系统构建初期纳入可控变量。

NCSC提出四项应对建议。首先,开发者需充分认识提示注入作为一种攻击手段的严重性,目前该风险尚未被广泛理解。同时,采用LLM的组织、安全专业人员及风险负责人应将其纳入整体风险管理框架。其次,LLM系统须遵循“安全设计”原则,重点部署确定性防护机制以限制模型行为,而非仅阻断恶意输入。此外,应严格实施最小权限原则,确保LLM所获权限不超过与其交互用户的权限范围。

该机构还指出,可通过技术手段区分指令与数据,使攻击者更难操控模型输出。例如,微软研究人员发现,对输入数据进行明确标记可增加提示注入难度。但NCSC警告,依赖关键词屏蔽等方法无效,因攻击者可轻易改写指令;对声称能完全阻止提示注入的技术供应商也应保持高度审慎。

最后,NCSC建议组织在设计阶段即评估LLM可能被滥用的路径及攻击目标,并建立全面日志机制,包括完整记录模型输入输出及调用的工具或API。实时监控工具或API调用失败情况尤为关键,此类异常可能是攻击者正在测试攻击方案的信号。

(以上内容均由Ai生成)

你可能还想读

Pebble创始人推75美元AI戒指,专注语音记事

Pebble创始人推75美元AI戒指,专注语音记事

快速阅读: 最新消息显示,Pebble创始人埃里克·米吉科夫斯基推出Core Devices公司新品Index01智能戒指,售价75美元,支持本地语音转文本、免订阅、两年续航及多语言转录,主打隐私安全与外部记忆功能。 Pebble智能手表创 […]

发布时间:2025年12月10日
印度拟强制AI公司为训练数据付费

印度拟强制AI公司为训练数据付费

快速阅读: 印度工业与内贸促进部发布消息称,拟推全球首个AI强制性一揽子版权许可制度,要求企业就使用公开作品训练模型统一缴费,覆盖文本、音乐、视听等内容,旨在保障创作者权益并降低合规成本,新规若通过将于2025年生效。 印度工业与内贸促进部 […]

发布时间:2025年12月10日
Mistral AI推Devstral2,性能跃升设商用门槛

Mistral AI推Devstral2,性能跃升设商用门槛

快速阅读: 据了解,Mistral AI发布第二代开源编码模型Devstral2及轻量版Devstral Small2,前者参数1230亿、需H100 GPU运行,后者240亿参数适配本地部署,许可策略差异化,新工具Mistral Vibe […]

发布时间:2025年12月10日
iFixit推AI维修助手FixBot

iFixit推AI维修助手FixBot

快速阅读: 据了解,iFixit推出AI维修助手FixBot,依托20年维修数据库支持7.2万种设备,提供语音交互与图像诊断,基础功能免费、高级功能现对iPhone用户限时免费。 日前,国外知名设备维修平台iFixit推出人工智能维修助手F […]

发布时间:2025年12月10日
微软Copilot升级,一键生成年终自评报告

微软Copilot升级,一键生成年终自评报告

快速阅读: 12月10日消息,微软推出Copilot年终绩效考核辅助工具,可整合多源数据生成自评报告,并提供敏感职场对话脚本,助力员工梳理隐形工作、优化沟通表达,提升绩效管理效率。 微软于近日宣布对其人工智能助手Microsoft Copi […]

发布时间:2025年12月10日
AI“心理创伤”报告引争议

AI“心理创伤”报告引争议

快速阅读: 最新消息显示,海外研究对Gemini、Claude和Grok等大模型进行模拟心理咨询,发现部分模型呈现拟人化情绪反应,学界警示应避免过度拟人化并加强科学评估。 日前,一项海外研究引发关注,探讨人工智能模型是否可能出现类似人类的心 […]

发布时间:2025年12月10日
阿里整合夸克UC打造千问超级APP

阿里整合夸克UC打造千问超级APP

快速阅读: 12月10日消息,阿里巴巴成立“千问C端事业群”,整合夸克、UC等核心应用及AI硬件业务,由吴嘉负责,旨在打造AI超级入口并拓展至眼镜、PC、汽车等多终端场景。 阿里巴巴集团日前宣布成立“千问C端事业群”,全面加码消费端人工智能 […]

发布时间:2025年12月10日
“智镜”发布:首个中国审美AI评测平台

“智镜”发布:首个中国审美AI评测平台

快速阅读: 消息人士透露,北京大学与清华大学等高校联合发布“智镜”平台,构建融合东方美学的七维评测体系,对28个大模型开展匿名评估,推动传统文化在智能时代的创新发展。 “人工智能与人文艺术研究合作仪式暨‘智镜’项目发布会”日前在北京大学举行 […]

发布时间:2025年12月10日