英伟达推Nemotron 3系列模型
快速阅读: 据英伟达公司消息,其于近日发布Nemotron 3开源模型系列,包含Nano、Super和Ultra三款混合专家架构模型,支持多智能体协同任务,推理吞吐量最高提升四倍,Super与Ultra版本将于2026年上半年推出,已获埃森哲、西门子等企业采用。
英伟达公司于近日发布新一代开源模型及数据资源库,旨在支持各行业构建高效、透明且高度专业化的智能体人工智能系统。此次推出的Nemotron 3系列包含Nano、Super和Ultra三种规模的模型,均采用混合专家(MoE)架构,可在多智能体系统中实现高吞吐量与良好扩展性。
其中,Nano模型相较前代产品推理吞吐量提升四倍,并具备百万级上下文窗口,适用于多智能体协同任务;Super模型总参数达1000亿,激活参数为100亿,面向中等复杂度的多智能体应用场景;Ultra作为高性能推理引擎,总参数达5000亿,激活参数500亿,可支撑复杂工作流中的高级推理需求。Super与Ultra模型预计将于2026年上半年正式推出。
该公司表示,当前企业正从单一模型聊天机器人转向协作式多智能体AI系统,Nemotron 3系列正是为满足此类应用对推理能力与工具编排的迫切需求而设计。该系列模型在降低推理成本的同时,兼顾高性能表现,适用于软件调试、内容摘要、智能助手流程及信息检索等任务。
目前,埃森哲、德勤、安永、甲骨文、Palantir、Perplexity、ServiceNow、西门子、新思科技和Zoom等企业已率先采用Nemotron模型,应用于制造、网络安全、软件开发、媒体及通信等领域的AI工作流。此外,该系列产品亦有助于英伟达在开源模型领域增强竞争力,以应对来自深度求索、阿里巴巴、月之暗面等公司日益增多的开源模型挑战。
(以上内容均由Ai生成)
引用自:Mobile World Live网站