英伟达4B小模型登顶ARC评测，成本仅GPT-5 Pro的136

发布时间：2025年12月8日来源：szf

快速阅读: 12月8日消息，英伟达推出4B参数小模型NVARC，在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro，单任务推理成本仅0.2美元，凭借零预训练策略和合成数据实现高效低成本部署。

近日，英伟达研发的4B参数小模型NVARC在ARC-AGI2评测中以27.64%的准确率位居榜首，显著超越GPT-5Pro的18.3%。该模型单任务推理成本仅为0.2美元，远低于后者7美元，在性能与成本双重维度上展现出突出优势。

此次评测聚焦模型在无直接训练数据条件下的快速学习与泛化能力，难度较以往大幅提升。NVARC的成功得益于其创新的零预训练深度学习策略，有效规避了传统大规模预训练带来的领域偏见和数据依赖问题。英伟达团队将复杂推理过程前置至离线合成数据管道，利用GPT-OSS-120B生成高质量谜题，并通过多阶段独立验证机制，构建包含320万条增强样本的合成数据集。

此外，该模型在推理模块采用改进版ARChitects方法，结合对话式模板简化任务理解。训练过程中，团队依托NeMo RL框架与Megatron后端进行监督微调，并引入TTFT技术，实现对新任务规则的快速适配。尽管部分观点质疑小模型的应用广度，但NVARC在特定场景中展现出的高效率、低成本和强适应性，凸显了其在实际部署中的重要价值。

专家指出，未来人工智能发展关键在于将合适的技术路径精准匹配应用场景，而非一味追求模型规模。NVARC的突破为高效、经济的AI系统提供了新范式，有望推动行业向更可持续的方向演进。

(以上内容均由Ai生成)