构建安全人工智能的解决方案是否在大脑中?

发布时间:2025年2月17日    来源:szf
构建安全人工智能的解决方案是否在大脑中?

快速阅读: 据《发射器》称,对抗样本是AI系统的棘手问题,单纯扩大数据集和计算能力无法解决。破解大脑对对抗样本的抵抗力,理解其泛化能力,将有助于提高AI系统的安全性与鲁棒性。神经科学不仅能增强AI的安全性,还能帮助验证AI系统的功能。大规模神经科学技术的进步有助于解决这些挑战,促进AI系统更符合人类价值观和意图。

对抗样本是当前AI系统中一个出乎意料的顽固问题:仅仅扩大数据集和计算能力无法解决这一问题;即使没有访问模型内部结构的机会,它们也能在现实世界中构建和部署;并且它们不仅影响视觉模型,还影响大型语言模型。如果我们能够破解大脑对对抗样本的抵抗力——理解它是如何如此有效地泛化到新情况的——并将这一点融入当前的AI系统中,我们将解决一个重要且悬而未决的安全和保障问题。神经科学可能不仅仅增强AI的安全性,还能提高其鲁棒性。规范问题——让AI系统“做我们想做的,而不是我们说的”——是AI安全的根本所在。作为人类,我们理解意图,在上下文中正确解释模糊指令,并平衡多个奖励以提炼指令的本质。这些能力源自能够实现心智理论、实用推理和社会规范理解的神经架构。通过研究大脑如何实施这些与规范相关的能力,我们可以开发出更好地符合人类价值观和意图的AI系统。最后,神经科学可以帮助我们验证AI系统是否按预期工作——通过帮助我们理解其内部结构。神经科学家在理解生物神经网络的反复纠缠方面已经取得了数十年的进展,研究人员现在正在应用各种受神经科学启发的方法来理解人工神经网络。继续这项工作,受到神经科学直觉和方法的指导,或许借助基于工具的AI,可以帮助确保AI系统按我们的意愿行事。当然,我们不能天真地认为人类的一切都是安全的。悉尼毕竟是在互联网上训练的,随机模仿了可能包含我们在社交媒体上的对抗性互动的人类生成文本。我们不必完全复制大脑:我们可以专注于模拟从AI安全角度来看有用的行为和计算。遗憾的是,许多与AI安全相关的认知机制尚未得到充分理解。为什么我们对对抗样本具有鲁棒性?我们是如何平衡竞争的奖励来源以维持稳态的?我们是如何模拟他人的思维以有效合作的?为了系统地解决这些雄心勃勃的问题,我们需要大规模的神经科学技术。神经技术的最新进展使得在多个层面上研究大脑变得越来越可行。过去十年,大脑计划等项目的大量投资促进了大规模神经科学的发展。新的组织和资金模式正在帮助克服主要的技术障碍;例如,E11生物科技公司和森林神经科技公司等专注的研究机构正在构建工具,以解决大脑测绘中的一些最大瓶颈,从单个神经元水平的电路测绘到在人脑中记录全脑活动。鉴于所有这些投资,我们倡导采取全面的方法来应对雄心勃勃的神经科学研究,建立工具和数据集来定义自然智能的科学。结合记录技术和计算方法的进步,现在正是开始理解大脑如何实现稳健、明确和可验证的智能的时候。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日