AI

Nvidia 推出 Nemotron-Nano-9B-v2 小型开放模型,支持可切换推理功能

发布时间:2025年9月1日    来源:szf
Nvidia 推出 Nemotron-Nano-9B-v2 小型开放模型,支持可切换推理功能

快速阅读: Nvidia发布9亿参数小型语言模型Nemotron-Nano-9B-v2,支持多语言及指令跟随等任务,引入推理切换和思考预算管理,提高准确性和响应速度,适用于高效部署。

近日,Nvidia 发布了新款小型语言模型 Nemotron-Nano-9B-v2,标志着小型模型的热潮再次升温。该模型拥有9亿个参数,虽然规模大于其他数百万参数的小型模型,但相比原始的12亿参数已有大幅缩减,旨在在一台 Nvidia A10 GPU 上高效运行。Nvidia 的 AI 模型后训练总监 Oleksii Kuchiaev 表示,减少参数是为了更好地适应部署需求,且该模型采用混合架构,在处理较大批量时比类似尺寸的变换模型快6倍。

Nemotron-Nano-9B-v2 支持多种语言,包括英语、德语、西班牙语、法语、意大利语、日语等,适用于指令跟随和代码生成等任务。该模型还引入了一项创新功能——用户可以通过简单的控制令牌切换 AI 的“推理”过程,即在给出答案前进行自我检查。系统默认生成推理痕迹,但用户可通过 /think 或 /no_think 等命令控制此过程。此外,模型还引入了“思考预算”管理机制,允许开发者设定推理过程中使用的标记数量,以在准确性和响应速度之间取得平衡。

测试结果显示,Nemotron-Nano-9B-v2 在多个基准测试中表现优异。在“推理开启”模式下,该模型在 AIME25、MATH500、GPQA 和 LiveCodeBench 等测试中均取得良好成绩。此外,它在指令跟随和长上下文基准测试中同样表现出色,显示出比其他开放小型模型更高的准确性。

Nvidia 为该模型设定了开放许可协议,允许开发者在商业上自由使用与分发,并明确不对生成的输出声索所有权。这意味企业可以立即投入使用,而无需担心使用门槛或费用。

Nvidia 推出的 Nemotron-Nano-9B-v2 模型为需要在小规模上实现推理能力和高效部署的开发者提供了新工具。其运行预算控制和推理切换功能为系统构建者提供了灵活性,旨在提高准确性和响应速度,进一步推动小型语言模型的发展。

(以上内容均由Ai生成)

你可能还想读

美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日
AI虚拟演员Tilly Norwood引行业争议

AI虚拟演员Tilly Norwood引行业争议

快速阅读: 据美联社报道,AI虚拟演员蒂莉·诺伍德由Particle6公司打造,旨在探索影视AI应用,团队正优化其自然表现并计划明年推出互动功能,但遭部分经纪公司抵制。 近日,人工智能虚拟演员“蒂莉·诺伍德”(Tilly Norwood)再 […]

发布时间:2025年12月8日
苹果硬件主管或离职,芯片业务面临巨变

苹果硬件主管或离职,芯片业务面临巨变

快速阅读: 据彭博社报道,苹果硬件技术主管斯鲁吉考虑离职,其主导自研M系列与A19 Pro芯片,深度支撑全系产品,潜在出走或重创苹果芯片优势并撼动行业格局。 据彭博社日前报道,苹果公司高级副总裁、硬件技术主管约翰尼·斯鲁吉正考虑离职。斯鲁吉 […]

发布时间:2025年12月8日