英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136
快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。
近日,英伟达研发的4B参数小模型NVARC在ARC-AGI2评测中以27.64%的准确率位居榜首,显著超越GPT-5Pro的18.3%。该模型单任务推理成本仅为0.2美元,远低于后者7美元,在性能与成本双重维度上展现出突出优势。
此次评测聚焦模型在无直接训练数据条件下的快速学习与泛化能力,难度较以往大幅提升。NVARC的成功得益于其创新的零预训练深度学习策略,有效规避了传统大规模预训练带来的领域偏见和数据依赖问题。英伟达团队将复杂推理过程前置至离线合成数据管道,利用GPT-OSS-120B生成高质量谜题,并通过多阶段独立验证机制,构建包含320万条增强样本的合成数据集。
此外,该模型在推理模块采用改进版ARChitects方法,结合对话式模板简化任务理解。训练过程中,团队依托NeMo RL框架与Megatron后端进行监督微调,并引入TTFT技术,实现对新任务规则的快速适配。尽管部分观点质疑小模型的应用广度,但NVARC在特定场景中展现出的高效率、低成本和强适应性,凸显了其在实际部署中的重要价值。
专家指出,未来人工智能发展关键在于将合适的技术路径精准匹配应用场景,而非一味追求模型规模。NVARC的突破为高效、经济的AI系统提供了新范式,有望推动行业向更可持续的方向演进。
(以上内容均由Ai生成)