英伟达推新模型抢占开源AI先机

发布时间:2025年12月15日    来源:szf
英伟达推新模型抢占开源AI先机

快速阅读: 据彭博社报道,英伟达发布Nemotron 3开源大模型系列,涵盖Nano至Ultra三款版本,显著提升上下文长度与推理效率,并全面开放训练数据与代码,以应对企业AI在成本、专业化和透明度上的核心挑战。

英伟达近日发布其开源大语言模型Nemotron系列的第三代产品,旨在提升生成式人工智能在企业应用中的准确性与成本效率。该系列包含三款新模型:Nemotron 3 Nano(300亿参数)、Super(1000亿参数)和Ultra(5000亿参数),相较前代显著扩展了上下文窗口并提升了处理速度。其中,Nano版本已上线HuggingFace平台,每秒处理的令牌数提升四倍,上下文窗口扩大至100万令牌,为前代的七倍。

英伟达生成式AI软件副总裁卡里·布里斯基表示,Nemotron 3聚焦解决开源、效率与智能三大核心问题。该公司强调其在数据透明度方面比Meta更具开放性,并指出今年已在HuggingFace平台上贡献最多开源项目。Super版本预计2026年1月发布,Ultra版本将于同年3月至4月推出。

与此同时,Meta的开源影响力正显现出减弱趋势。自2023年2月首次推出Llama模型以来,其一度引领开源AI发展,但2025年4月发布的Llama 4反响平平,且陷入开发争议。目前,Llama系列已跌出LMSYS LMArena排行榜前100名,榜单主要由谷歌Gemini、xAI的Grok、Anthropic的Claude、OpenAI的GPT-5.2等闭源模型,以及DeepSeek、阿里通义千问(Qwen)和Moonshot AI的Kimi K2等开源模型占据。

第三方机构Artificial Analysis的数据印证了这一趋势。Menlo Ventures近期发布的《生成式AI现状》报告指出,Llama模型自2025年4月以来未有重大更新,导致企业开源AI使用占比从19%降至11%。此外,据彭博社报道,Meta内部正推进代号“Avocado”的新项目,可能以闭源形式推出,标志着其长期坚持的开源战略或将发生重大转变。新任首席AI官亚历山大·王被指倾向闭源路线,进一步加剧外界对其战略调整的猜测。

针对有关开源人工智能发展面临挑战的说法,布里斯基近日回应称,尽管部分模型热度有所下降,但整体开源生态依然活跃。她指出,阿里巴巴的Qwen系列模型和DeepSeek等开源模型在企业中广泛应用,众多公司正基于这些模型进行微调与部署。

当前,企业AI应用面临三大核心挑战。首先是成本优化问题。布里斯基强调,单一模型难以满足复杂应用场景需求,企业普遍采用前沿闭源模型与高效开源模型相结合的方式,通过智能路由选择最优模型,以平衡性能与成本。英伟达推出的Nemotron 3系列模型覆盖从Nano到Ultra多个层级,旨在适配不同任务对算力和精度的要求。

其次是模型专业化需求。在网络安全、电子设计自动化、医疗健康等垂直领域,企业需在本地部署可定制的开源模型,以保护敏感数据并支持领域专家完成“最后一公里”的适配工作。布里斯基指出,前沿大模型虽具备强大通用能力,但并非所有数据都适合上传至云端处理。

第三是推理成本持续攀升。随着用户查询复杂度增加,单次请求所调用的大模型次数显著上升——从一年前的约10次增至当前的100次,导致文本、图像等输出令牌的生成成本快速膨胀。

为应对上述挑战,Nemotron 3引入“潜在混合专家”(Latent Mixture of Experts)架构,在保持低延迟和高带宽的同时,显著提升内存效率。据称,该技术使KV缓存占用减少75%,内存使用效率提升四倍。第三方评测显示,Nemotron 3 Nano在输出准确率和每秒生成令牌数方面已超越OpenAI的GPT-OSS模型。

此外,英伟达同步开源了用于预训练、后训练及强化学习的数万亿令牌训练数据,并在HuggingFace平台发布完整模型权重与源代码。其中包含专门用于智能体安全评估的独立数据集,旨在提升复杂AI系统在真实场景中的可靠性。布里斯基表示,企业客户高度重视模型透明度,此次全面开放训练数据与代码,有助于构建可信、可控的AI应用基础。

近日,有关人工智能模型开源透明度的问题引发关注。布里斯基指出,Meta在其Llama系列大模型的开放策略上存在局限,仅发布模型权重,未公开训练数据集。她透露,去年英伟达与Meta合作尝试通过“蒸馏”技术将Llama 3.1压缩为更小的Nemotron模型时,Meta未提供任何训练数据支持。“即便是作为重要合作伙伴,我们也未能获得哪怕一小部分数据用于模型蒸馏,”布里斯基称,“相关方法最终只能由我们自行摸索。”

这一现象折射出当前开源AI领域透明度下降的趋势。麻省理工学院学者近期对HuggingFace平台上的代码仓库开展广泛研究,发现真正符合开源标准的模型数量正在减少。研究报告指出,模型训练数据的可用性与披露程度均呈明显下滑。研究团队强调,根据开源倡议组织的定义,真正的开源AI模型不仅需公开模型权重,还应提供“足够详细的训练数据信息”。缺乏数据披露的模型,仅能被视为“开放权重”,而非“开源”。

目前,英伟达与Meta在AI战略上呈现不同侧重。Meta正投入数千亿美元建设AI数据中心,亟需通过AI业务证明其商业价值以稳定资本市场信心。而作为全球市值最高的企业,英伟达则致力于维系开发者对其芯片平台的依赖,该平台构成其主要收入来源。

此外,Meta首席执行官扎克伯格近期表示,Llama模型仍具重要价值,并透露Llama 4在后训练阶段持续优化,使用量稳步提升。但他同时强调,公司新成立的超级智能实验室(MSL)将聚焦开发具备前沿能力的新型模型,以开拓更大应用潜力。对此,布里斯基重申:“大语言模型和生成式AI将成为未来软件开发的新平台。”她援引英伟达创始人黄仁勋的话称:“我们将长期坚定支持这一方向。”

(以上内容均由Ai生成)

引用自:ZDNet科技媒体

你可能还想读

印度初创Digantara融资5000万美元推进天基导弹防御

印度初创Digantara融资5000万美元推进天基导弹防御

快速阅读: 据多方确认,印度空间监视企业Digantara完成5000万美元B轮融资,将拓展导弹跟踪业务,以应对全球天基防御需求上升。该公司依托自研传感器技术,已获得美国太空司令部合同,并计划两年内发射15颗卫星,同时扩建在印度、美国和欧洲 […]

发布时间:2025年12月17日
Adobe发布Firefly精准AI视频编辑工具

Adobe发布Firefly精准AI视频编辑工具

快速阅读: 据消息指出,Adobe推出新一代AI视频编辑工具,依托Firefly平台整合多家模型,支持自然语言提示词编辑与跨模型调整,以解决AI生成内容“幻觉”问题,并开放介于基础剪辑与Premiere Pro之间的公开测试版,推动一站式创 […]

发布时间:2025年12月17日
12月值得买入的两只AI股票

12月值得买入的两只AI股票

快速阅读: 据行业统计,受甲骨文与博通财报疲软拖累,AI概念股普遍回调,部分优质标的估值回归合理区间。澳大利亚企业Iren股价较11月高点腰斩,但该公司已获得微软97亿美元合作订单,并聚焦可再生能源数据中心;Alphabet则凭借稳健现金流 […]

发布时间:2025年12月17日
CIO预测2026年AI将重塑企业 workforce 策略

CIO预测2026年AI将重塑企业 workforce 策略

快速阅读: 公开资料显示,受监管不统一与经济压力影响,2025年企业技术高管虽聚焦AI应用以推动增长,但CIO对投入持审慎态度。智能体AI虽引发关注,成功案例仍少,预计2026年将在部分场景从概念走向实践,但大规模落地仍面临部署复杂与效果不 […]

发布时间:2025年12月17日
迪拜千禧大酒店发布AI节日短片

迪拜千禧大酒店发布AI节日短片

快速阅读: 媒体注意到,迪拜Grand Millennium酒店近日推出AI生成节日短片《以孩童之眼观节庆》,通过儿童视角唤起节日温情,强化品牌亲和力。影片在多平台传播效果显著,Instagram获1.6万次曝光,领英达3.8万次曝光,并引 […]

发布时间:2025年12月17日
AI重建古罗马场景被曝充斥史实错误

AI重建古罗马场景被曝充斥史实错误

快速阅读: 消息人士透露,一段AI生成的古罗马视频因包含现代建筑和时代错置的装饰等史实错误,引发学者批评。法国波尔多蒙田大学教授库尔迪指出,该内容虽视觉逼真,却严重背离考古证据,恐误导公众对历史的认知。 近日,一段名为《古罗马|AI生成视频 […]

发布时间:2025年12月17日
Applied Digital股价暴跌17% 因AI数据中心债务风险

Applied Digital股价暴跌17% 因AI数据中心债务风险

快速阅读: 截至今日,受AI数据中心扩张推动,Applied Digital子公司于11月发行23.5亿美元高息票据,用于支持项目及偿债,但其偿债能力高度依赖核心租户CoreWeave,存在较大风险。 受人工智能数据中心业务快速扩张影响,A […]

发布时间:2025年12月17日
以色列研究:机器学习精准预测作物日耗水量

以色列研究:机器学习精准预测作物日耗水量

快速阅读: 据媒体报道,以色列希伯来大学研究团队利用七年温室数据训练出机器学习模型,可精准预测作物日蒸腾量,R²达0.82,并通过识别偏离正常值的情况,早期发现干旱或病害等胁迫,为智能灌溉与节水农业提供新路径。 以色列一项新研究显示,机器学 […]

发布时间:2025年12月17日