Yoshua Bengio 提出“科学家 AI”来减轻超级智能代理的灾难性风险

发布时间:2025年2月25日    来源:szf
Yoshua Bengio 提出“科学家 AI”来减轻超级智能代理的灾难性风险

快速阅读: 据《印度分析杂志》称,图灵奖得主杨立昆等人提出了一种名为“科学家AI”的新系统,旨在加速科研进程并防范危险的自主性AI。科学家AI通过观察解释世界,而非追求特定目标,且能提供可靠解释及避免目标误设。该系统在增强计算能力时将更安全、更准确,有望引领更安全的发展路径。详细内容可参见相关链接。杨立昆与他人因深度学习领域的贡献共同荣获2018年ACM阿曼图灵奖。

图灵奖得主杨立昆与一群人工智能研究员周一提出了“科学家AI”。这一人工智能系统旨在加速科学研究和进展,同时作为护栏防止“不安全的自主性AI”。作者们检查了构建模拟人类认知的人工智能系统的不足之处。他们表示,“人工智能系统中的人类式自主性可能会重现并放大有害的人类倾向,可能导致灾难性后果。”他们补充说,将人工智能代理(设计为自主追求目标的系统)的力量与超人能力结合起来,可能会“促成危险的、失控的人工智能系统”。这导致了“科学家AI”的提议,它们能够理解世界,并根据这种理解进行推理——而不是仅仅追求预定目标。不同于被训练去追求目标的自主性AI,科学家AI被训练去提供事件的解释及其估计概率,以提供事件的解释及其估计概率。此外,该系统旨在避免强化学习的风险,这是一种旨在最大化长期累积奖励的训练方式——作者们表示这可能会“轻易导致目标误设和错误泛化”。所提议的系统不是被训练来最大化奖励,而是通过观察来解释世界,而不是采取行动来模仿或取悦人类。基于对世界的了解,该系统对其输出提供可靠解释,人类或其他人工智能系统可以深入探讨每个论点的理由,类似于同行评审。为了避免自我实现的预测,作者们表示,“预测可以在模拟世界中的假设环境中做出,在这个环境中,科学家AI要么不存在,要么不对世界其他部分产生影响。”科学家AI据称随着计算能力的提升会变得更安全、更准确——与传统系统不同,作者们认为传统系统“随着计算能力的提高,往往会变得更加容易出现错位和欺骗行为”。“我们希望这些论点能激励研究人员、开发者和政策制定者选择这条更安全的道路,”作者们说。详细报告全文可在下方链接查看。2018年ACM阿曼图灵奖得主杨立昆与扬·勒丘恩和杰弗里·欣顿共同获得,这一奖项常被视为“计算机界的诺贝尔奖”,即ACM阿曼图灵奖。三人因他们在深度学习领域的开创性工作而广受认可。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日