英伟达推新模型抢占开源AI先机

发布时间:2025年12月15日    来源:szf
英伟达推新模型抢占开源AI先机

快速阅读: 据彭博社报道,英伟达发布Nemotron 3开源大模型系列,涵盖Nano至Ultra三款版本,显著提升上下文长度与推理效率,并全面开放训练数据与代码,以应对企业AI在成本、专业化和透明度上的核心挑战。

英伟达近日发布其开源大语言模型Nemotron系列的第三代产品,旨在提升生成式人工智能在企业应用中的准确性与成本效率。该系列包含三款新模型:Nemotron 3 Nano(300亿参数)、Super(1000亿参数)和Ultra(5000亿参数),相较前代显著扩展了上下文窗口并提升了处理速度。其中,Nano版本已上线HuggingFace平台,每秒处理的令牌数提升四倍,上下文窗口扩大至100万令牌,为前代的七倍。

英伟达生成式AI软件副总裁卡里·布里斯基表示,Nemotron 3聚焦解决开源、效率与智能三大核心问题。该公司强调其在数据透明度方面比Meta更具开放性,并指出今年已在HuggingFace平台上贡献最多开源项目。Super版本预计2026年1月发布,Ultra版本将于同年3月至4月推出。

与此同时,Meta的开源影响力正显现出减弱趋势。自2023年2月首次推出Llama模型以来,其一度引领开源AI发展,但2025年4月发布的Llama 4反响平平,且陷入开发争议。目前,Llama系列已跌出LMSYS LMArena排行榜前100名,榜单主要由谷歌Gemini、xAI的Grok、Anthropic的Claude、OpenAI的GPT-5.2等闭源模型,以及DeepSeek、阿里通义千问(Qwen)和Moonshot AI的Kimi K2等开源模型占据。

第三方机构Artificial Analysis的数据印证了这一趋势。Menlo Ventures近期发布的《生成式AI现状》报告指出,Llama模型自2025年4月以来未有重大更新,导致企业开源AI使用占比从19%降至11%。此外,据彭博社报道,Meta内部正推进代号“Avocado”的新项目,可能以闭源形式推出,标志着其长期坚持的开源战略或将发生重大转变。新任首席AI官亚历山大·王被指倾向闭源路线,进一步加剧外界对其战略调整的猜测。

针对有关开源人工智能发展面临挑战的说法,布里斯基近日回应称,尽管部分模型热度有所下降,但整体开源生态依然活跃。她指出,阿里巴巴的Qwen系列模型和DeepSeek等开源模型在企业中广泛应用,众多公司正基于这些模型进行微调与部署。

当前,企业AI应用面临三大核心挑战。首先是成本优化问题。布里斯基强调,单一模型难以满足复杂应用场景需求,企业普遍采用前沿闭源模型与高效开源模型相结合的方式,通过智能路由选择最优模型,以平衡性能与成本。英伟达推出的Nemotron 3系列模型覆盖从Nano到Ultra多个层级,旨在适配不同任务对算力和精度的要求。

其次是模型专业化需求。在网络安全、电子设计自动化、医疗健康等垂直领域,企业需在本地部署可定制的开源模型,以保护敏感数据并支持领域专家完成“最后一公里”的适配工作。布里斯基指出,前沿大模型虽具备强大通用能力,但并非所有数据都适合上传至云端处理。

第三是推理成本持续攀升。随着用户查询复杂度增加,单次请求所调用的大模型次数显著上升——从一年前的约10次增至当前的100次,导致文本、图像等输出令牌的生成成本快速膨胀。

为应对上述挑战,Nemotron 3引入“潜在混合专家”(Latent Mixture of Experts)架构,在保持低延迟和高带宽的同时,显著提升内存效率。据称,该技术使KV缓存占用减少75%,内存使用效率提升四倍。第三方评测显示,Nemotron 3 Nano在输出准确率和每秒生成令牌数方面已超越OpenAI的GPT-OSS模型。

此外,英伟达同步开源了用于预训练、后训练及强化学习的数万亿令牌训练数据,并在HuggingFace平台发布完整模型权重与源代码。其中包含专门用于智能体安全评估的独立数据集,旨在提升复杂AI系统在真实场景中的可靠性。布里斯基表示,企业客户高度重视模型透明度,此次全面开放训练数据与代码,有助于构建可信、可控的AI应用基础。

近日,有关人工智能模型开源透明度的问题引发关注。布里斯基指出,Meta在其Llama系列大模型的开放策略上存在局限,仅发布模型权重,未公开训练数据集。她透露,去年英伟达与Meta合作尝试通过“蒸馏”技术将Llama 3.1压缩为更小的Nemotron模型时,Meta未提供任何训练数据支持。“即便是作为重要合作伙伴,我们也未能获得哪怕一小部分数据用于模型蒸馏,”布里斯基称,“相关方法最终只能由我们自行摸索。”

这一现象折射出当前开源AI领域透明度下降的趋势。麻省理工学院学者近期对HuggingFace平台上的代码仓库开展广泛研究,发现真正符合开源标准的模型数量正在减少。研究报告指出,模型训练数据的可用性与披露程度均呈明显下滑。研究团队强调,根据开源倡议组织的定义,真正的开源AI模型不仅需公开模型权重,还应提供“足够详细的训练数据信息”。缺乏数据披露的模型,仅能被视为“开放权重”,而非“开源”。

目前,英伟达与Meta在AI战略上呈现不同侧重。Meta正投入数千亿美元建设AI数据中心,亟需通过AI业务证明其商业价值以稳定资本市场信心。而作为全球市值最高的企业,英伟达则致力于维系开发者对其芯片平台的依赖,该平台构成其主要收入来源。

此外,Meta首席执行官扎克伯格近期表示,Llama模型仍具重要价值,并透露Llama 4在后训练阶段持续优化,使用量稳步提升。但他同时强调,公司新成立的超级智能实验室(MSL)将聚焦开发具备前沿能力的新型模型,以开拓更大应用潜力。对此,布里斯基重申:“大语言模型和生成式AI将成为未来软件开发的新平台。”她援引英伟达创始人黄仁勋的话称:“我们将长期坚定支持这一方向。”

(以上内容均由Ai生成)

引用自:ZDNet科技媒体

你可能还想读

英伟达成全球价值最高公司

英伟达成全球价值最高公司

快速阅读: 据胡润研究院发布的报告,受AI芯片与数据中心需求激增推动,英伟达以32.8万亿元企业价值跃居全球高质量企业榜首,超越微软与苹果。中国共有158家企业上榜,占总数的15.8%,其中国企83家;在非上市企业中,OpenAI与字节跳动 […]

发布时间:2025年12月16日
昆仑芯完成股改加速推进上市

昆仑芯完成股改加速推进上市

快速阅读: 据知情人士透露,昆仑芯(北京)科技有限公司正加速推进赴港上市进程,目前已接近完成股份制改造。该公司前身为百度智能芯片部门,2025年营收显著超20亿元,计划2026年提交IPO申请,目标2027年初完成上市。 昆仑芯(北京)科技 […]

发布时间:2025年12月16日
全球首个侵入式脑机接口获批治疗药物成瘾

全球首个侵入式脑机接口获批治疗药物成瘾

快速阅读: 据中国国家药品监督管理局消息,12月15日批准景昱医疗全球首个侵入式脑机接口三类产品,用于治疗难治性阿片类药物成瘾。该系统通过深部脑刺激调节大脑奖赏通路,临床试验显示10年随访戒断率达69%,且无明显认知或功能副作用。 12月1 […]

发布时间:2025年12月16日
Stickerbox语音生成贴纸激发儿童创造力

Stickerbox语音生成贴纸激发儿童创造力

快速阅读: 据官方透露,2025年儿童AI创意硬件Stickerbox引发关注。该设备通过语音实时生成并打印贴纸,无需屏幕交互,兼顾安全与趣味;其零屏幕设计、环保材料及内容过滤机制契合3至10岁儿童需求,业内认为此举填补了亲子科技玩具市场空 […]

发布时间:2025年12月16日
日本科学家推Sui语言实现大模型代码零错误

日本科学家推Sui语言实现大模型代码零错误

快速阅读: 据官方通报,日本数据科学家本田崇人推出专为大模型设计的编程语言Sui,通过数字变量名与独立行指令杜绝语法错误,提升AI生成代码的准确率。该语言虽已转为遗留项目,但其“AI优先”理念正由继任者Isu延续,推动自主编程发展。 在大模 […]

发布时间:2025年12月16日
台积电将扩大CoWoS前段委外规模

台积电将扩大CoWoS前段委外规模

快速阅读: 据电子时报报道,受AI芯片需求激增推动,台积电CoWoS先进封装产能持续紧缺,计划自2026年下半年起扩大委外CoW工艺订单。目前日月光、安靠等封测厂已承接部分后段工序,预计到2026年底,台积电与合作厂商合计月产能将达16.5 […]

发布时间:2025年12月16日
三星将获英特尔8nm PCH芯片订单

三星将获英特尔8nm PCH芯片订单

快速阅读: 据韩国经济日报报道,三星电子晶圆代工部门即将获得英特尔8nm工艺PCH芯片订单,该产品将于2026年量产。此举有助于英特尔优化产能布局,并使其自有代工厂聚焦于高利润产品。 据《韩国经济日报》12月16日报道,三星电子晶圆代工部门 […]

发布时间:2025年12月16日
工信部批准首批L3级自动驾驶车型上路试点

工信部批准首批L3级自动驾驶车型上路试点

快速阅读: 据工业和信息化部消息,我国首批L3级有条件自动驾驶车型获准入许可,长安、北汽两款车型将在北京、重庆指定路段开展试点。此举标志着L3技术迈向商业化关键一步,但运行范围受限,安全验证与法规配套仍待完善。 12月15日,工业和信息化部 […]

发布时间:2025年12月16日