推理扩展成为 AISC 2025 的下一个前沿领域
快速阅读: 据《越南新闻》称,2025年人工智能与半导体国际会议探讨了AI推理扩展的新方法,通过增加推理阶段的计算资源提高AI性能,展示在软件、硬件及芯片设计中的应用潜力与挑战,强调其经济高效性与实用性。
斯坦福大学教授兼谷歌DeepMind人工智能研究员阿里亚扎·米尔霍塞尼在会议上发言。——越通社记者达进摄
河内——2025年人工智能与半导体国际会议(AISC 2025)于河内召开,推理扩展的概念被视为人工智能领域的一项颠覆性方法。
会议自3月12日至16日在河内举办,同时在岘港设有分会场,吸引了超过千名来自全球的技术专家和行业领袖。此次会议由越南国家创新中心(NIC)与美国AI公司Aitomatic联合主办,重点探讨了人工智能和半导体的进步如何重塑计算的未来。
会议的一个关键主题是将计算能力分配至推理阶段,而非仅仅聚焦于训练阶段。根据斯坦福大学教授兼谷歌DeepMind人工智能研究员阿里亚扎·米尔霍塞尼的说法,推理扩展已成为提升AI性能的新方向。
她将其比喻为“无限猴子”法,即在足够多的尝试后,AI模型能够生成多个输出并最终找到正确答案。这一方法与传统的人工智能开发形成鲜明对比,后者通常优先考虑预训练和微调作为主要的扩展策略。
**AI推理扩展及其对准确性的影响**
在AISC 2025上分享的新兴研究表明,允许AI生成多个解决方案并选择最佳方案可以显著提高正确回应的概率。一个名为“大型语言猴子”的框架展示了在相同提示下多次运行大型语言模型(LLM),同时由自动验证器评估每个输出,可以显著提升正确回应的概率。
在推理和编程任务中,研究人员观察到答对的概率(称为覆盖率)随着推理尝试次数的增加而呈可预测地增长。
根据米尔霍塞尼的说法,这符合推理时间的扩展规律,类似于已建立的训练时间扩展规律。她解释说,在自动化验证可能的领域——例如软件单元测试或数学证明验证——这种方法直接增强了问题解决的成功率。
例如,在软件开发基准测试中,基于AI的代码生成器在单次尝试中解决了15.9%的编码问题。然而,当给予250次尝试时,其准确性提高到56%,超过了之前最佳的单一模型,该模型在单次场景中达到了43%的准确率。即使是一个较小的700亿参数开源模型,在给予足够的推理运行次数后,也可以在特定的编码和推理任务中匹配或超越像GPT-4这样的更大模型。这些发现表明,推理期间的计算努力可以弥补模型大小较小或训练数据有限的问题,使先进的AI能力更加普及,而无需大规模模型。
**应用实例**
在AISC 2025上,研究人员展示了推理扩展在软件工程、硬件编程和半导体设计中的几个现实世界应用。
在软件开发方面,一个名为“代码猴子”的原型系统将推理扩展应用于编程任务。AI生成多个候选代码编辑和错误修复,并通过单元测试自动评估每个候选方案。根据米尔霍塞尼的说法,这一过程让AI能反复优化其输出,选择最优化的解决方案。关键在于,在推理阶段分配更多的计算能力——而非初始训练阶段——增强了AI编写、调试和优化代码的能力。
在硬件编程方面,研究人员引入了“内核基准”工具,利用推理扩展自动化低级编程任务。编写优化的内核代码——这是高性能计算的关键——传统上需要大量的手动工作。“内核基准”工具让AI模型生成内核代码,接收编译器反馈和性能指标,并通过多次迭代优化其输出。这一迭代过程使AI能够自动化复杂的编程任务,否则这些任务需要大量的人类专业知识和时间。
会议还强调了AI在芯片设计中的日益增长的影响,谷歌的AlphaChip项目就是一个突出的例子。AlphaChip利用深度强化学习自动化芯片布局规划,这是半导体设计的重要步骤。据谷歌称,其AI生成的芯片布局在所有性能指标上与人类设计相当甚至更优,同时所需时间显著减少。一个人类工程师需要几个月才能完成的平面图,AlphaChip的AI仅需不到六小时即可生成。米尔霍塞尼指出,推理扩展可进一步提升AI驱动的芯片设计,实现快速评估数千种设计变体以提高效率和性能。
**推理扩展的意义与挑战**
推理扩展的出现标志着人工智能开发的根本转变。传统上,AI研究注重扩大模型规模和数据集容量来提升性能。然而,AISC 2025上展示的研究结果表明,重新分配计算资源到推理阶段可能会解锁潜在的人工智能能力,而无需更大的模型。
这一转变也给硬件和软件基础设施带来了新的挑战。随着AI推理工作负载的增长,研发专用AI芯片以优化高吞吐量推理将是至关重要的。
AISC 2025上的讨论突出了下一代AI加速器和并行处理技术,旨在降低与推理扩展相关的计算成本。
与会专家乐观地认为推理扩展将成为一种经济高效且实用的AI部署方式。通过结合先进的推理策略、自动化验证和高性能硬件,AI系统可能很快就能解决以前被认为过于复杂或计算昂贵的问题。
——越通社
标签:人工智能、半导体、推理扩展、AISC 2025
(以上内容均由Ai生成)