英伟达推开源模型赋能AI智能体
快速阅读: 据金融时报报道,英伟达发布开源大模型Nemotron 3,涵盖Nano、Super和Ultra三个版本,采用混合稀疏专家架构以提升推理吞吐量与多智能体协同能力,并首次全面开放权重与工具,推动其从硬件厂商向AI软件生态延伸。
近日,英伟达正式发布开源大模型Nemotron 3,包含Nano、Super和Ultra三个版本。该系列采用混合稀疏专家(MoE)架构,旨在提升推理吞吐量、扩展上下文理解能力,并支持多智能体工作流的可扩展性能。开发者与企业可获取模型权重、配套数据及工具,用于定制AI智能体,覆盖编程、逻辑推理到复杂流程自动化等任务。
开源AI模型指其神经网络权重与代码公开,允许下载、审查、修改和再分发。相比由单一厂商控制的闭源模型,开源方案赋予开发者更高灵活性,便于适配特定场景、验证行为并嵌入现有系统。行业普遍认为,真正开放的AI还应披露训练数据与方法,以保障可信度与可复现性。尽管开源模型在原始性能上通常略逊于最新闭源系统,但其成本低、部署灵活,在边缘计算和定制应用中优势显著。随着技术快速迭代,二者性能差距正持续缩小。
英伟达此次举措标志着其从硬件供应商向基础AI软件提供方的战略延伸。此前,该公司虽推出过Nemotron早期版本及领域专用模型,但多作为参考设计或绑定企业服务。而Nemotron 3首次广泛开放模型权重、强化学习环境及相关库,彰显其对开源生态的深度投入。此举契合企业对自主部署、行为可审计、私有数据微调及系统集成的需求,同时仍能带动其GPU、网络与软件工具的使用。
目前,全球开源模型竞争日趋激烈,尤以中国进展显著。据《金融时报》报道,国产模型在多项基准测试中已比肩西方产品,且更注重训练与推理成本优化。例如,杭州初创公司DeepSeek推出的DeepSeek-V3凭借高效架构实现优异推理与编码能力,降低对高端GPU依赖;阿里云Qwen系列则覆盖多尺寸、多任务,在Hugging Face等平台长期位居开源榜单前列,广泛应用于企业与消费场景。
(以上内容均由Ai生成)
引用自:PYMNTS网站