Yoshua Bengio 提出“科学家 AI”来减轻超级智能代理的灾难性风险

发布时间:2025年2月25日    来源:szf
Yoshua Bengio 提出“科学家 AI”来减轻超级智能代理的灾难性风险

快速阅读: 据《印度分析杂志》称,图灵奖得主杨立昆等人提出了一种名为“科学家AI”的新系统,旨在加速科研进程并防范危险的自主性AI。科学家AI通过观察解释世界,而非追求特定目标,且能提供可靠解释及避免目标误设。该系统在增强计算能力时将更安全、更准确,有望引领更安全的发展路径。详细内容可参见相关链接。杨立昆与他人因深度学习领域的贡献共同荣获2018年ACM阿曼图灵奖。

图灵奖得主杨立昆与一群人工智能研究员周一提出了“科学家AI”。这一人工智能系统旨在加速科学研究和进展,同时作为护栏防止“不安全的自主性AI”。作者们检查了构建模拟人类认知的人工智能系统的不足之处。他们表示,“人工智能系统中的人类式自主性可能会重现并放大有害的人类倾向,可能导致灾难性后果。”他们补充说,将人工智能代理(设计为自主追求目标的系统)的力量与超人能力结合起来,可能会“促成危险的、失控的人工智能系统”。这导致了“科学家AI”的提议,它们能够理解世界,并根据这种理解进行推理——而不是仅仅追求预定目标。不同于被训练去追求目标的自主性AI,科学家AI被训练去提供事件的解释及其估计概率,以提供事件的解释及其估计概率。此外,该系统旨在避免强化学习的风险,这是一种旨在最大化长期累积奖励的训练方式——作者们表示这可能会“轻易导致目标误设和错误泛化”。所提议的系统不是被训练来最大化奖励,而是通过观察来解释世界,而不是采取行动来模仿或取悦人类。基于对世界的了解,该系统对其输出提供可靠解释,人类或其他人工智能系统可以深入探讨每个论点的理由,类似于同行评审。为了避免自我实现的预测,作者们表示,“预测可以在模拟世界中的假设环境中做出,在这个环境中,科学家AI要么不存在,要么不对世界其他部分产生影响。”科学家AI据称随着计算能力的提升会变得更安全、更准确——与传统系统不同,作者们认为传统系统“随着计算能力的提高,往往会变得更加容易出现错位和欺骗行为”。“我们希望这些论点能激励研究人员、开发者和政策制定者选择这条更安全的道路,”作者们说。详细报告全文可在下方链接查看。2018年ACM阿曼图灵奖得主杨立昆与扬·勒丘恩和杰弗里·欣顿共同获得,这一奖项常被视为“计算机界的诺贝尔奖”,即ACM阿曼图灵奖。三人因他们在深度学习领域的开创性工作而广受认可。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日