英伟达推新模型抢占开源AI先机

快速阅读: 据彭博社报道，英伟达发布Nemotron 3开源大模型系列，涵盖Nano至Ultra三款版本，显著提升上下文长度与推理效率，并全面开放训练数据与代码，以应对企业AI在成本、专业化和透明度上的核心挑战。

英伟达近日发布其开源大语言模型Nemotron系列的第三代产品，旨在提升生成式人工智能在企业应用中的准确性与成本效率。该系列包含三款新模型：Nemotron 3 Nano（300亿参数）、Super（1000亿参数）和Ultra（5000亿参数），相较前代显著扩展了上下文窗口并提升了处理速度。其中，Nano版本已上线HuggingFace平台，每秒处理的令牌数提升四倍，上下文窗口扩大至100万令牌，为前代的七倍。

英伟达生成式AI软件副总裁卡里·布里斯基表示，Nemotron 3聚焦解决开源、效率与智能三大核心问题。该公司强调其在数据透明度方面比Meta更具开放性，并指出今年已在HuggingFace平台上贡献最多开源项目。Super版本预计2026年1月发布，Ultra版本将于同年3月至4月推出。

与此同时，Meta的开源影响力正显现出减弱趋势。自2023年2月首次推出Llama模型以来，其一度引领开源AI发展，但2025年4月发布的Llama 4反响平平，且陷入开发争议。目前，Llama系列已跌出LMSYS LMArena排行榜前100名，榜单主要由谷歌Gemini、xAI的Grok、Anthropic的Claude、OpenAI的GPT-5.2等闭源模型，以及DeepSeek、阿里通义千问（Qwen）和Moonshot AI的Kimi K2等开源模型占据。

第三方机构Artificial Analysis的数据印证了这一趋势。Menlo Ventures近期发布的《生成式AI现状》报告指出，Llama模型自2025年4月以来未有重大更新，导致企业开源AI使用占比从19%降至11%。此外，据彭博社报道，Meta内部正推进代号“Avocado”的新项目，可能以闭源形式推出，标志着其长期坚持的开源战略或将发生重大转变。新任首席AI官亚历山大·王被指倾向闭源路线，进一步加剧外界对其战略调整的猜测。

针对有关开源人工智能发展面临挑战的说法，布里斯基近日回应称，尽管部分模型热度有所下降，但整体开源生态依然活跃。她指出，阿里巴巴的Qwen系列模型和DeepSeek等开源模型在企业中广泛应用，众多公司正基于这些模型进行微调与部署。

当前，企业AI应用面临三大核心挑战。首先是成本优化问题。布里斯基强调，单一模型难以满足复杂应用场景需求，企业普遍采用前沿闭源模型与高效开源模型相结合的方式，通过智能路由选择最优模型，以平衡性能与成本。英伟达推出的Nemotron 3系列模型覆盖从Nano到Ultra多个层级，旨在适配不同任务对算力和精度的要求。

其次是模型专业化需求。在网络安全、电子设计自动化、医疗健康等垂直领域，企业需在本地部署可定制的开源模型，以保护敏感数据并支持领域专家完成“最后一公里”的适配工作。布里斯基指出，前沿大模型虽具备强大通用能力，但并非所有数据都适合上传至云端处理。

第三是推理成本持续攀升。随着用户查询复杂度增加，单次请求所调用的大模型次数显著上升——从一年前的约10次增至当前的100次，导致文本、图像等输出令牌的生成成本快速膨胀。

为应对上述挑战，Nemotron 3引入“潜在混合专家”（Latent Mixture of Experts）架构，在保持低延迟和高带宽的同时，显著提升内存效率。据称，该技术使KV缓存占用减少75%，内存使用效率提升四倍。第三方评测显示，Nemotron 3 Nano在输出准确率和每秒生成令牌数方面已超越OpenAI的GPT-OSS模型。

此外，英伟达同步开源了用于预训练、后训练及强化学习的数万亿令牌训练数据，并在HuggingFace平台发布完整模型权重与源代码。其中包含专门用于智能体安全评估的独立数据集，旨在提升复杂AI系统在真实场景中的可靠性。布里斯基表示，企业客户高度重视模型透明度，此次全面开放训练数据与代码，有助于构建可信、可控的AI应用基础。

近日，有关人工智能模型开源透明度的问题引发关注。布里斯基指出，Meta在其Llama系列大模型的开放策略上存在局限，仅发布模型权重，未公开训练数据集。她透露，去年英伟达与Meta合作尝试通过“蒸馏”技术将Llama 3.1压缩为更小的Nemotron模型时，Meta未提供任何训练数据支持。“即便是作为重要合作伙伴，我们也未能获得哪怕一小部分数据用于模型蒸馏，”布里斯基称，“相关方法最终只能由我们自行摸索。”

这一现象折射出当前开源AI领域透明度下降的趋势。麻省理工学院学者近期对HuggingFace平台上的代码仓库开展广泛研究，发现真正符合开源标准的模型数量正在减少。研究报告指出，模型训练数据的可用性与披露程度均呈明显下滑。研究团队强调，根据开源倡议组织的定义，真正的开源AI模型不仅需公开模型权重，还应提供“足够详细的训练数据信息”。缺乏数据披露的模型，仅能被视为“开放权重”，而非“开源”。

目前，英伟达与Meta在AI战略上呈现不同侧重。Meta正投入数千亿美元建设AI数据中心，亟需通过AI业务证明其商业价值以稳定资本市场信心。而作为全球市值最高的企业，英伟达则致力于维系开发者对其芯片平台的依赖，该平台构成其主要收入来源。

此外，Meta首席执行官扎克伯格近期表示，Llama模型仍具重要价值，并透露Llama 4在后训练阶段持续优化，使用量稳步提升。但他同时强调，公司新成立的超级智能实验室（MSL）将聚焦开发具备前沿能力的新型模型，以开拓更大应用潜力。对此，布里斯基重申：“大语言模型和生成式AI将成为未来软件开发的新平台。”她援引英伟达创始人黄仁勋的话称：“我们将长期坚定支持这一方向。”

(以上内容均由Ai生成)

引用自：ZDNet科技媒体