英伟达推新模型抢占开源AI先机
快速阅读: 据彭博社报道,英伟达发布Nemotron 3开源大模型系列,涵盖Nano至Ultra三款版本,显著提升上下文长度与推理效率,并全面开放训练数据与代码,以应对企业AI在成本、专业化和透明度上的核心挑战。
英伟达近日发布其开源大语言模型Nemotron系列的第三代产品,旨在提升生成式人工智能在企业应用中的准确性与成本效率。该系列包含三款新模型:Nemotron 3 Nano(300亿参数)、Super(1000亿参数)和Ultra(5000亿参数),相较前代显著扩展了上下文窗口并提升了处理速度。其中,Nano版本已上线HuggingFace平台,每秒处理的令牌数提升四倍,上下文窗口扩大至100万令牌,为前代的七倍。
英伟达生成式AI软件副总裁卡里·布里斯基表示,Nemotron 3聚焦解决开源、效率与智能三大核心问题。该公司强调其在数据透明度方面比Meta更具开放性,并指出今年已在HuggingFace平台上贡献最多开源项目。Super版本预计2026年1月发布,Ultra版本将于同年3月至4月推出。
与此同时,Meta的开源影响力正显现出减弱趋势。自2023年2月首次推出Llama模型以来,其一度引领开源AI发展,但2025年4月发布的Llama 4反响平平,且陷入开发争议。目前,Llama系列已跌出LMSYS LMArena排行榜前100名,榜单主要由谷歌Gemini、xAI的Grok、Anthropic的Claude、OpenAI的GPT-5.2等闭源模型,以及DeepSeek、阿里通义千问(Qwen)和Moonshot AI的Kimi K2等开源模型占据。
第三方机构Artificial Analysis的数据印证了这一趋势。Menlo Ventures近期发布的《生成式AI现状》报告指出,Llama模型自2025年4月以来未有重大更新,导致企业开源AI使用占比从19%降至11%。此外,据彭博社报道,Meta内部正推进代号“Avocado”的新项目,可能以闭源形式推出,标志着其长期坚持的开源战略或将发生重大转变。新任首席AI官亚历山大·王被指倾向闭源路线,进一步加剧外界对其战略调整的猜测。
针对有关开源人工智能发展面临挑战的说法,布里斯基近日回应称,尽管部分模型热度有所下降,但整体开源生态依然活跃。她指出,阿里巴巴的Qwen系列模型和DeepSeek等开源模型在企业中广泛应用,众多公司正基于这些模型进行微调与部署。
当前,企业AI应用面临三大核心挑战。首先是成本优化问题。布里斯基强调,单一模型难以满足复杂应用场景需求,企业普遍采用前沿闭源模型与高效开源模型相结合的方式,通过智能路由选择最优模型,以平衡性能与成本。英伟达推出的Nemotron 3系列模型覆盖从Nano到Ultra多个层级,旨在适配不同任务对算力和精度的要求。
其次是模型专业化需求。在网络安全、电子设计自动化、医疗健康等垂直领域,企业需在本地部署可定制的开源模型,以保护敏感数据并支持领域专家完成“最后一公里”的适配工作。布里斯基指出,前沿大模型虽具备强大通用能力,但并非所有数据都适合上传至云端处理。
第三是推理成本持续攀升。随着用户查询复杂度增加,单次请求所调用的大模型次数显著上升——从一年前的约10次增至当前的100次,导致文本、图像等输出令牌的生成成本快速膨胀。
为应对上述挑战,Nemotron 3引入“潜在混合专家”(Latent Mixture of Experts)架构,在保持低延迟和高带宽的同时,显著提升内存效率。据称,该技术使KV缓存占用减少75%,内存使用效率提升四倍。第三方评测显示,Nemotron 3 Nano在输出准确率和每秒生成令牌数方面已超越OpenAI的GPT-OSS模型。
此外,英伟达同步开源了用于预训练、后训练及强化学习的数万亿令牌训练数据,并在HuggingFace平台发布完整模型权重与源代码。其中包含专门用于智能体安全评估的独立数据集,旨在提升复杂AI系统在真实场景中的可靠性。布里斯基表示,企业客户高度重视模型透明度,此次全面开放训练数据与代码,有助于构建可信、可控的AI应用基础。
近日,有关人工智能模型开源透明度的问题引发关注。布里斯基指出,Meta在其Llama系列大模型的开放策略上存在局限,仅发布模型权重,未公开训练数据集。她透露,去年英伟达与Meta合作尝试通过“蒸馏”技术将Llama 3.1压缩为更小的Nemotron模型时,Meta未提供任何训练数据支持。“即便是作为重要合作伙伴,我们也未能获得哪怕一小部分数据用于模型蒸馏,”布里斯基称,“相关方法最终只能由我们自行摸索。”
这一现象折射出当前开源AI领域透明度下降的趋势。麻省理工学院学者近期对HuggingFace平台上的代码仓库开展广泛研究,发现真正符合开源标准的模型数量正在减少。研究报告指出,模型训练数据的可用性与披露程度均呈明显下滑。研究团队强调,根据开源倡议组织的定义,真正的开源AI模型不仅需公开模型权重,还应提供“足够详细的训练数据信息”。缺乏数据披露的模型,仅能被视为“开放权重”,而非“开源”。
目前,英伟达与Meta在AI战略上呈现不同侧重。Meta正投入数千亿美元建设AI数据中心,亟需通过AI业务证明其商业价值以稳定资本市场信心。而作为全球市值最高的企业,英伟达则致力于维系开发者对其芯片平台的依赖,该平台构成其主要收入来源。
此外,Meta首席执行官扎克伯格近期表示,Llama模型仍具重要价值,并透露Llama 4在后训练阶段持续优化,使用量稳步提升。但他同时强调,公司新成立的超级智能实验室(MSL)将聚焦开发具备前沿能力的新型模型,以开拓更大应用潜力。对此,布里斯基重申:“大语言模型和生成式AI将成为未来软件开发的新平台。”她援引英伟达创始人黄仁勋的话称:“我们将长期坚定支持这一方向。”
(以上内容均由Ai生成)
引用自:ZDNet科技媒体