Meta推出SPICE框架,AI系统自我对弈提升推理能力

发布时间:2025年11月12日    来源:szf
Meta推出SPICE框架,AI系统自我对弈提升推理能力

快速阅读: Meta与新加坡国立大学合作开发SPICE框架,通过自我对弈让AI系统在无监督情况下提升推理能力。挑战者与推理者角色分离,减少错误,测试中表现优异,展示广泛适用性。

Meta 的人工智能研究团队与新加坡国立大学合作开发了一种名为 “自我对弈环境中的自我提升”(SPICE)的新型强化学习框架。该框架通过让两个 AI 代理相互对抗,创造自我提升的挑战,使其在没有人类监督的情况下逐渐提高能力。目前,这一框架仍处于概念验证阶段,但有望为未来能够动态适应环境的 AI 系统奠定基础,从而在面对现实世界的不可预测性时更加稳健。

自我提升 AI 的目标是让系统通过与环境的互动来增强自身能力。传统方法通常依赖于人类策划的问题集和奖励机制,这使得扩展变得困难。而自我对弈的方式让模型通过相互竞争来实现提升。然而,现有自我对弈方法在语言模型上的应用受到一些限制,如生成问题和答案中的事实错误相互叠加,导致 “幻觉” 现象。此外,当问题生成者和解答者共享相同知识库时,无法生成新挑战,容易陷入重复模式。

SPICE 框架采用一种创新的自我对弈机制,其中一个模型承担两个角色:“挑战者” 构建来自大量文档的困难问题,而 “推理者” 则尝试在没有访问源文档的情况下解决这些问题。这种设置打破了信息对称,使得推理者无法使用挑战者用来生成问题的知识,进而减少错误的发生。

这种对抗性动态创造了一个自动化的课程,挑战者会因生成多样且恰好位于推理者能力边界的难题而获奖,而推理者则因正确回答而获奖。这种互惠的互动促进了两个角色的共同成长,推动他们不断发现并克服新的挑战。由于该系统利用的是原始文档,而非预定义的问题 – 答案对,因而可以生成多种任务格式,适用于不同领域,打破了以往方法在特定领域的局限。

研究人员对多个基础模型进行评估,发现 SPICE 在数学和一般推理任务中表现出色,超过了其他基线模型。这一发现表明,通过基于语料库的自我对弈所培养的推理能力能够有效迁移到不同模型上,预示着自我提升推理方法的新时代。

论文:https://arxiv.org/abs/2510.24684 划重点: ✅ SPICE 框架通过自我对弈,让 AI 系统在无监督情况下逐渐提升推理能力。

✅ 挑战者与推理者角色分离,打破信息对称,减少错误发生。

✅ SPICE 在多个模型测试中表现优异,展示了其广泛的适用性和有效性。

(以上内容均由Ai生成)

你可能还想读

台积电:十年先进制程功耗降76%

台积电:十年先进制程功耗降76%

快速阅读: 据台积电披露,其从2018年N7到2028年A14制程十年间功耗降低76%,能效提升4.2倍,并推进N3P制程与HBM4E内存集成,强化AI及高性能计算芯片效能。 台积电日前在2025年OIP生态系统论坛欧洲场披露,从2018年 […]

发布时间:2025年12月8日
美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日
AI虚拟演员Tilly Norwood引行业争议

AI虚拟演员Tilly Norwood引行业争议

快速阅读: 据美联社报道,AI虚拟演员蒂莉·诺伍德由Particle6公司打造,旨在探索影视AI应用,团队正优化其自然表现并计划明年推出互动功能,但遭部分经纪公司抵制。 近日,人工智能虚拟演员“蒂莉·诺伍德”(Tilly Norwood)再 […]

发布时间:2025年12月8日