OpenAI警示:ChatGPT Atlas遭“即时注入”攻击风险
快速阅读: OpenAI推广ChatGPT Atlas,但内部安全主管Stuckey指出“即时注入”攻击未彻底解决,存在数据泄露风险。OpenAI已采取“注销模式”和“监视模式”两项措施应对,但仍需进一步研发防护功能。
【AIbase报道】尽管 OpenAI 正在积极推广其新一代智能浏览器 ChatGPT Atlas,但公司内部安全主管 Dane Stuckey 近日公开表达了对其潜在安全风险的担忧,引起业界广泛关注。
Stuckey 指出,Atlas 面临的最大挑战之一是尚未彻底解决的“即时注入”(Prompt Injection)攻击问题。这种攻击通过在网页、邮件或其他内容中巧妙嵌入恶意指令,诱导 AI 代理执行非预期操作,不仅可能干扰用户的购买决策,还可能导致私人数据如电子邮件内容或登录凭证被窃取。
他坦承,尽管 OpenAI 已经进行了大规模的安全测试,并在 Atlas 中引入了多重防护机制和新的模型训练方法,“即时注入”仍然是一个棘手的问题,短期内难以完全解决。
为了缓解这一风险,OpenAI 在 Atlas 中实施了两项关键防御措施:一是“注销模式”,当需要时可以阻止 AI 代理访问用户数据,防止信息泄露;二是“监视模式”,针对敏感网站,要求用户在关键交互过程中进行人工确认和监督,确保操作安全。
Stuckey 表示,团队正加快研发更多的防护功能和快速响应系统,以便在面临潜在攻击时能够第一时间进行干预和修复。“Atlas 的安全挑战不仅是技术问题,也是人与 AI 协作新边界的测试。”他强调。
(以上内容均由Ai生成)