推理扩展成为 AISC 2025 的下一个前沿领域

发布时间:2025年3月13日    来源:szf
推理扩展成为 AISC 2025 的下一个前沿领域

快速阅读: 据《越南新闻》称,2025年人工智能与半导体国际会议探讨了AI推理扩展的新方法,通过增加推理阶段的计算资源提高AI性能,展示在软件、硬件及芯片设计中的应用潜力与挑战,强调其经济高效性与实用性。

斯坦福大学教授兼谷歌DeepMind人工智能研究员阿里亚扎·米尔霍塞尼在会议上发言。——越通社记者达进摄
河内——2025年人工智能与半导体国际会议(AISC 2025)于河内召开,推理扩展的概念被视为人工智能领域的一项颠覆性方法。

会议自3月12日至16日在河内举办,同时在岘港设有分会场,吸引了超过千名来自全球的技术专家和行业领袖。此次会议由越南国家创新中心(NIC)与美国AI公司Aitomatic联合主办,重点探讨了人工智能和半导体的进步如何重塑计算的未来。

会议的一个关键主题是将计算能力分配至推理阶段,而非仅仅聚焦于训练阶段。根据斯坦福大学教授兼谷歌DeepMind人工智能研究员阿里亚扎·米尔霍塞尼的说法,推理扩展已成为提升AI性能的新方向。

她将其比喻为“无限猴子”法,即在足够多的尝试后,AI模型能够生成多个输出并最终找到正确答案。这一方法与传统的人工智能开发形成鲜明对比,后者通常优先考虑预训练和微调作为主要的扩展策略。

**AI推理扩展及其对准确性的影响**

在AISC 2025上分享的新兴研究表明,允许AI生成多个解决方案并选择最佳方案可以显著提高正确回应的概率。一个名为“大型语言猴子”的框架展示了在相同提示下多次运行大型语言模型(LLM),同时由自动验证器评估每个输出,可以显著提升正确回应的概率。

在推理和编程任务中,研究人员观察到答对的概率(称为覆盖率)随着推理尝试次数的增加而呈可预测地增长。

根据米尔霍塞尼的说法,这符合推理时间的扩展规律,类似于已建立的训练时间扩展规律。她解释说,在自动化验证可能的领域——例如软件单元测试或数学证明验证——这种方法直接增强了问题解决的成功率。

例如,在软件开发基准测试中,基于AI的代码生成器在单次尝试中解决了15.9%的编码问题。然而,当给予250次尝试时,其准确性提高到56%,超过了之前最佳的单一模型,该模型在单次场景中达到了43%的准确率。即使是一个较小的700亿参数开源模型,在给予足够的推理运行次数后,也可以在特定的编码和推理任务中匹配或超越像GPT-4这样的更大模型。这些发现表明,推理期间的计算努力可以弥补模型大小较小或训练数据有限的问题,使先进的AI能力更加普及,而无需大规模模型。

**应用实例**

在AISC 2025上,研究人员展示了推理扩展在软件工程、硬件编程和半导体设计中的几个现实世界应用。

在软件开发方面,一个名为“代码猴子”的原型系统将推理扩展应用于编程任务。AI生成多个候选代码编辑和错误修复,并通过单元测试自动评估每个候选方案。根据米尔霍塞尼的说法,这一过程让AI能反复优化其输出,选择最优化的解决方案。关键在于,在推理阶段分配更多的计算能力——而非初始训练阶段——增强了AI编写、调试和优化代码的能力。

在硬件编程方面,研究人员引入了“内核基准”工具,利用推理扩展自动化低级编程任务。编写优化的内核代码——这是高性能计算的关键——传统上需要大量的手动工作。“内核基准”工具让AI模型生成内核代码,接收编译器反馈和性能指标,并通过多次迭代优化其输出。这一迭代过程使AI能够自动化复杂的编程任务,否则这些任务需要大量的人类专业知识和时间。

会议还强调了AI在芯片设计中的日益增长的影响,谷歌的AlphaChip项目就是一个突出的例子。AlphaChip利用深度强化学习自动化芯片布局规划,这是半导体设计的重要步骤。据谷歌称,其AI生成的芯片布局在所有性能指标上与人类设计相当甚至更优,同时所需时间显著减少。一个人类工程师需要几个月才能完成的平面图,AlphaChip的AI仅需不到六小时即可生成。米尔霍塞尼指出,推理扩展可进一步提升AI驱动的芯片设计,实现快速评估数千种设计变体以提高效率和性能。

**推理扩展的意义与挑战**

推理扩展的出现标志着人工智能开发的根本转变。传统上,AI研究注重扩大模型规模和数据集容量来提升性能。然而,AISC 2025上展示的研究结果表明,重新分配计算资源到推理阶段可能会解锁潜在的人工智能能力,而无需更大的模型。

这一转变也给硬件和软件基础设施带来了新的挑战。随着AI推理工作负载的增长,研发专用AI芯片以优化高吞吐量推理将是至关重要的。

AISC 2025上的讨论突出了下一代AI加速器和并行处理技术,旨在降低与推理扩展相关的计算成本。

与会专家乐观地认为推理扩展将成为一种经济高效且实用的AI部署方式。通过结合先进的推理策略、自动化验证和高性能硬件,AI系统可能很快就能解决以前被认为过于复杂或计算昂贵的问题。

——越通社

标签:人工智能、半导体、推理扩展、AISC 2025

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日