英伟达推开源模型赋能AI智能体

发布时间：2025年12月16日来源：szf

快速阅读: 据金融时报报道，英伟达发布开源大模型Nemotron 3，涵盖Nano、Super和Ultra三个版本，采用混合稀疏专家架构以提升推理吞吐量与多智能体协同能力，并首次全面开放权重与工具，推动其从硬件厂商向AI软件生态延伸。

近日，英伟达正式发布开源大模型Nemotron 3，包含Nano、Super和Ultra三个版本。该系列采用混合稀疏专家（MoE）架构，旨在提升推理吞吐量、扩展上下文理解能力，并支持多智能体工作流的可扩展性能。开发者与企业可获取模型权重、配套数据及工具，用于定制AI智能体，覆盖编程、逻辑推理到复杂流程自动化等任务。

开源AI模型指其神经网络权重与代码公开，允许下载、审查、修改和再分发。相比由单一厂商控制的闭源模型，开源方案赋予开发者更高灵活性，便于适配特定场景、验证行为并嵌入现有系统。行业普遍认为，真正开放的AI还应披露训练数据与方法，以保障可信度与可复现性。尽管开源模型在原始性能上通常略逊于最新闭源系统，但其成本低、部署灵活，在边缘计算和定制应用中优势显著。随着技术快速迭代，二者性能差距正持续缩小。

英伟达此次举措标志着其从硬件供应商向基础AI软件提供方的战略延伸。此前，该公司虽推出过Nemotron早期版本及领域专用模型，但多作为参考设计或绑定企业服务。而Nemotron 3首次广泛开放模型权重、强化学习环境及相关库，彰显其对开源生态的深度投入。此举契合企业对自主部署、行为可审计、私有数据微调及系统集成的需求，同时仍能带动其GPU、网络与软件工具的使用。

目前，全球开源模型竞争日趋激烈，尤以中国进展显著。据《金融时报》报道，国产模型在多项基准测试中已比肩西方产品，且更注重训练与推理成本优化。例如，杭州初创公司DeepSeek推出的DeepSeek-V3凭借高效架构实现优异推理与编码能力，降低对高端GPU依赖；阿里云Qwen系列则覆盖多尺寸、多任务，在Hugging Face等平台长期位居开源榜单前列，广泛应用于企业与消费场景。

(以上内容均由Ai生成)

引用自：PYMNTS网站