推理扩展成为 AISC 2025 的下一个前沿领域

快速阅读: 据《越南新闻》称，2025年人工智能与半导体国际会议探讨了AI推理扩展的新方法，通过增加推理阶段的计算资源提高AI性能，展示在软件、硬件及芯片设计中的应用潜力与挑战，强调其经济高效性与实用性。

斯坦福大学教授兼谷歌DeepMind人工智能研究员阿里亚扎·米尔霍塞尼在会议上发言。——越通社记者达进摄
河内——2025年人工智能与半导体国际会议（AISC 2025）于河内召开，推理扩展的概念被视为人工智能领域的一项颠覆性方法。

会议自3月12日至16日在河内举办，同时在岘港设有分会场，吸引了超过千名来自全球的技术专家和行业领袖。此次会议由越南国家创新中心（NIC）与美国AI公司Aitomatic联合主办，重点探讨了人工智能和半导体的进步如何重塑计算的未来。

会议的一个关键主题是将计算能力分配至推理阶段，而非仅仅聚焦于训练阶段。根据斯坦福大学教授兼谷歌DeepMind人工智能研究员阿里亚扎·米尔霍塞尼的说法，推理扩展已成为提升AI性能的新方向。

她将其比喻为“无限猴子”法，即在足够多的尝试后，AI模型能够生成多个输出并最终找到正确答案。这一方法与传统的人工智能开发形成鲜明对比，后者通常优先考虑预训练和微调作为主要的扩展策略。

**AI推理扩展及其对准确性的影响**

在AISC 2025上分享的新兴研究表明，允许AI生成多个解决方案并选择最佳方案可以显著提高正确回应的概率。一个名为“大型语言猴子”的框架展示了在相同提示下多次运行大型语言模型（LLM），同时由自动验证器评估每个输出，可以显著提升正确回应的概率。

在推理和编程任务中，研究人员观察到答对的概率（称为覆盖率）随着推理尝试次数的增加而呈可预测地增长。

根据米尔霍塞尼的说法，这符合推理时间的扩展规律，类似于已建立的训练时间扩展规律。她解释说，在自动化验证可能的领域——例如软件单元测试或数学证明验证——这种方法直接增强了问题解决的成功率。

例如，在软件开发基准测试中，基于AI的代码生成器在单次尝试中解决了15.9%的编码问题。然而，当给予250次尝试时，其准确性提高到56%，超过了之前最佳的单一模型，该模型在单次场景中达到了43%的准确率。即使是一个较小的700亿参数开源模型，在给予足够的推理运行次数后，也可以在特定的编码和推理任务中匹配或超越像GPT-4这样的更大模型。这些发现表明，推理期间的计算努力可以弥补模型大小较小或训练数据有限的问题，使先进的AI能力更加普及，而无需大规模模型。

**应用实例**

在AISC 2025上，研究人员展示了推理扩展在软件工程、硬件编程和半导体设计中的几个现实世界应用。

在软件开发方面，一个名为“代码猴子”的原型系统将推理扩展应用于编程任务。AI生成多个候选代码编辑和错误修复，并通过单元测试自动评估每个候选方案。根据米尔霍塞尼的说法，这一过程让AI能反复优化其输出，选择最优化的解决方案。关键在于，在推理阶段分配更多的计算能力——而非初始训练阶段——增强了AI编写、调试和优化代码的能力。

在硬件编程方面，研究人员引入了“内核基准”工具，利用推理扩展自动化低级编程任务。编写优化的内核代码——这是高性能计算的关键——传统上需要大量的手动工作。“内核基准”工具让AI模型生成内核代码，接收编译器反馈和性能指标，并通过多次迭代优化其输出。这一迭代过程使AI能够自动化复杂的编程任务，否则这些任务需要大量的人类专业知识和时间。

会议还强调了AI在芯片设计中的日益增长的影响，谷歌的AlphaChip项目就是一个突出的例子。AlphaChip利用深度强化学习自动化芯片布局规划，这是半导体设计的重要步骤。据谷歌称，其AI生成的芯片布局在所有性能指标上与人类设计相当甚至更优，同时所需时间显著减少。一个人类工程师需要几个月才能完成的平面图，AlphaChip的AI仅需不到六小时即可生成。米尔霍塞尼指出，推理扩展可进一步提升AI驱动的芯片设计，实现快速评估数千种设计变体以提高效率和性能。

**推理扩展的意义与挑战**

推理扩展的出现标志着人工智能开发的根本转变。传统上，AI研究注重扩大模型规模和数据集容量来提升性能。然而，AISC 2025上展示的研究结果表明，重新分配计算资源到推理阶段可能会解锁潜在的人工智能能力，而无需更大的模型。

这一转变也给硬件和软件基础设施带来了新的挑战。随着AI推理工作负载的增长，研发专用AI芯片以优化高吞吐量推理将是至关重要的。

AISC 2025上的讨论突出了下一代AI加速器和并行处理技术，旨在降低与推理扩展相关的计算成本。

与会专家乐观地认为推理扩展将成为一种经济高效且实用的AI部署方式。通过结合先进的推理策略、自动化验证和高性能硬件，AI系统可能很快就能解决以前被认为过于复杂或计算昂贵的问题。

——越通社

标签：人工智能、半导体、推理扩展、AISC 2025

(以上内容均由Ai生成)