新的 AI 防御方法可保护模型免受对抗性攻击

发布时间:2025年3月7日    来源:szf
新的 AI 防御方法可保护模型免受对抗性攻击

快速阅读: 据《科技探索》称,洛斯阿拉莫斯国家实验室的研究人员开发了一种名为LoRID的新方法,通过生成去噪扩散过程和张量分解技术,有效抵御对抗性攻击,提高神经网络的稳健性。该方法在多种基准数据集测试中表现出色,显著提升了AI的安全性和可靠性。

一个未来的神经网络正遭受激烈的对抗攻击;左侧,扭曲和被污染的数据流(红色)压倒了神经网络,右侧,强大的AI去噪能量机制(蓝色)消除了干扰并恢复了网络。图片由马尼什·巴塔赖使用DALL-E创建。

神经网络,一种模仿人脑连接的人工智能模型,正在推动广泛科学领域的关键突破。但这些模型面临着来自对抗性攻击的重大威胁,这些攻击可以破坏预测并产生错误信息。洛斯阿拉莫斯国家实验室的研究人员现在开创了一种新型的净化策略,以对抗对抗性攻击并保持神经网络的稳健性能。他们的研究已发表在arXiv预印本服务器上。“对AI系统的对抗性攻击可以表现为输入图像上的微小、几乎看不见的调整,细微修改可以使模型朝攻击者想要的结果倾斜,”洛斯阿拉莫斯计算机科学家马尼什·巴塔赖说。“这种漏洞让恶意行为者能够在伪装成正常输出的情况下,向数字渠道中注入欺骗性或有害内容,直接威胁到AI驱动技术的信任和可靠性。”

低秩迭代扩散(LoRID)方法通过利用生成去噪扩散过程以及先进的张量分解技术的力量,从输入数据中去除对抗性干预。在一系列基准测试数据集测试中,LoRID在对抗性噪声消除方面实现了无与伦比的准确性,可能推进更安全、可靠的AI能力。击败危险噪声扩散是一种通过向数据添加噪声然后训练模型去除噪声来训练AI模型的技术。通过学习清理噪声,AI模型有效地学习了数据的基本结构,使其能够自行生成逼真的样本。在基于扩散的净化过程中,模型利用其对“干净”数据的学习表示来识别并消除任何引入输入的对抗性干扰。不幸的是,应用过多的去噪步骤可能会从数据中剥离掉重要细节——想象一下过度擦洗一张照片以至于失去清晰度——而太少的步骤则会让有害扰动继续存在。LoRID方法通过在扩散过程的早期阶段进行多轮去噪来平衡这一权衡,帮助模型消除恰好正确的噪声量,而不损害数据的有意义内容,从而增强模型的抗攻击能力。至关重要的是,对抗性输入通常会揭示微妙的“低秩”特征——这些模式可以避开复杂的防御。通过编织一种称为张量分解的技术,LoRID定位这些低秩特征,在大规模对抗性攻击中增强了模型的防御能力。

该团队使用广泛认可的基准数据集CIFAR-10、CIFAR-100、Celeb-HQ和ImageNet测试了LoRID,评估其在最先进的黑盒和白盒对抗性攻击中的表现。在白盒攻击中,对手完全了解AI模型的架构和参数。在黑盒攻击中,他们只能看到输入和输出,模型的内部工作隐藏起来。在所有测试中,LoRID始终优于其他方法,尤其是在鲁棒准确性的方面——这是衡量模型在对抗威胁下的可靠性的关键指标。文多帮助解锁效率和结果

该团队在实验室最新的人工智能超级计算机文多上运行了LoRID模型,测试了一系列最先进的视觉模型在黑盒和白盒对抗性攻击下的表现。通过利用多个文多节点进行了数周的计算——考虑到巨大的计算需求,这是一项雄心勃勃的努力——他们成为第一个进行全面分析的团队。文多的强大功能将数月的模拟时间压缩到了几天,将整个开发周期从数年缩短到仅仅一个月,并大幅降低了计算成本。鲁棒的净化方法可以在应用神经网络或机器学习应用的任何地方增强AI的安全性。“我们的方法在著名的数据集上达到了最先进的性能,在白盒和黑盒攻击场景下表现出色,”洛斯阿拉莫斯AI研究员明·武说。“这一成就意味着我们现在可以在使用数据训练基础模型之前对其进行净化,无论是私有还是公共来源的数据,确保它们的安全性和完整性,同时持续提供准确的结果。”

更多信息:盖奇·佐利科弗等人,《LoRID:用于对抗性净化的低秩迭代扩散》,arXiv,2024。DOI: 10.48550/arxiv.2409.08255

(以上内容均由Ai生成)

你可能还想读

美众议院拟本周表决国防法案

美众议院拟本周表决国防法案

快速阅读: 12月8日消息,美国国会众议院本周将表决2026财年《国防授权法案》,限制总统单方面撤军、加码对华投资限制、取消对叙制裁,并提高国防预算80亿美元,法案尚待参议院通过及总统签署。 美国国会众议院计划于本周就《国防授权法案》进行表 […]

发布时间:2025年12月8日
泰军空袭柬军据点夺回边境领土

泰军空袭柬军据点夺回边境领土

快速阅读: 据泰军第一军区作战中心通报,12月8日泰国皇家陆军在沙缴府发起军事行动,驱逐越界柬军并空袭其伪装赌场的武器据点,称此举系应对主权威胁、维护和平协议。 今日,泰国皇家陆军在沙缴府边境地区发起军事行动,旨在收复被侵占的主权领土。据泰 […]

发布时间:2025年12月8日
日方称中方舰机在冲绳附近危险挑衅

日方称中方舰机在冲绳附近危险挑衅

快速阅读: 12月8日消息,日方称中国海军战机12月7日间歇性用火控雷达照射其F-15战机,指此举属危险行为并已提出抗议,中方尚未回应,此类事件易加剧地区紧张。 12月7日,日本方面称中国海军战机曾间歇性使用火控雷达照射其F-15战斗机。火 […]

发布时间:2025年12月8日
巴基斯坦首任国防军总司令获三军仪仗致敬

巴基斯坦首任国防军总司令获三军仪仗致敬

快速阅读: 据巴基斯坦国家电视台报道,巴总统任命陆军参谋长穆尼尔为首任国防军总司令,废除运行近50年的三军联合参谋长委员会机制,旨在提升联合作战效能与决策效率。 巴基斯坦总统近日依据宪法第27修正案,任命陆军参谋长阿西姆·穆尼尔为该国首任国 […]

发布时间:2025年12月8日
Historic Milestone Arrow 3 System Handover Marks New Chapte

Historic Milestone Arrow 3 System Handover Marks New Chapte

快速阅读: 据最新消息,以色列向德国交付“箭-3”导弹防御系统,以方称此举标志两国防务合作开启,该系统具备大气层外拦截能力,已实战验证可应对伊朗等远程威胁。 以色列国防部代表团近日在德国出席“箭-3”导弹防御系统交付仪式。该代表团由以国防部 […]

发布时间:2025年12月8日
以色列航太向泰国空军交付先进防空系统

以色列航太向泰国空军交付先进防空系统

快速阅读: 12月8日消息,以色列航空航天工业公司获泰国皇家空军合同,将供应“巴拉克MX”中程防空系统,覆盖150公里,具备弹道与空气动力目标双重拦截能力,并与泰方企业合作提供全周期支持。 以色列航空航天工业公司(IAI)今日宣布,已获得向 […]

发布时间:2025年12月8日
塔塔与洛克希德共建C-130J维修基地

塔塔与洛克希德共建C-130J维修基地

快速阅读: 12月8日消息,印度塔塔先进系统公司与美国洛克希德·马丁公司在班加罗尔启动C-130J运输机MRO设施奠基,支持印空军现役机队并为未来80架采购奠定基础,预计2027年初投入运营。 12月8日,印度塔塔先进系统公司与美国洛克希德 […]

发布时间:2025年12月8日
美国批准向意大利出售3亿美元远程空地导弹

美国批准向意大利出售3亿美元远程空地导弹

快速阅读: 据美国国防安全合作局消息,美国国务院近日批准向意大利出售100枚JASSM-ER导弹及配套装备与服务,总值3.01亿美元,旨在提升其防务能力以支持北约安全,交易尚待国会审查。 美国国务院近日批准一项对意大利的潜在对外军售,拟向其 […]

发布时间:2025年12月8日