IBM 发布边缘 AI 专用 Granite4.0Nano 系列模型

发布时间:2025年11月1日    来源:szf
IBM 发布边缘 AI 专用 Granite4.0Nano 系列模型

快速阅读: IBM发布Granite4.0Nano系列小型模型,专为本地和边缘推理设计,增强企业控制力和开源许可,涵盖8个模型,支持多种运行环境,性能优异,适用于AI工程和软件开发。

近日,IBM AI 团队发布了 Granite4.0Nano 系列,这是一组专为本地和边缘推理设计的小型模型,旨在为企业提供更强的控制力和开源许可。该系列包括8个模型,分为350M和约1B两种规模,采用混合SSM和变换器架构,支持基本和指令两种模式。所有模型均在Apache 2.0许可下发布,并能在vLLM、llama.cpp和MLX等流行运行环境中原生运行。

Granite4.0Nano 系列涵盖四条模型线及其基础版本。其中,Granite4.0H1B采用混合SSM架构,参数量约为1.5B;而Granite4.0H350M同样采用混合方法,参数量为350M。为确保最大的运行时兼容性,IBM还提供了Granite4.01B和Granite4.0350M的变换器版本。

这些H变体模型通过交替使用SSM层和变换器层设计,相比纯变换器在内存增长方面具有显著优势,同时保留了变换器模块的通用性。Granite4.0Nano 模型未采用减少数据管道的方式,而是遵循与大规模Granite4.0模型相同的训练方法,使用超过15万亿个标记进行训练,并经过指令调整,以增强工具使用和指令遵循能力。

IBM还将Granite4.0Nano与Qwen、Gemma和LiquidAI LFM等同类模型进行了对比,结果显示,Granite4.0Nano在通用知识、数学、代码及安全性等领域表现优异。此外,该系列模型在代理任务上也取得了出色成绩,在IFEval和伯克利函数调用排行榜第3版中排名第三。

这些模型经过ISO42001认证,并以加密签名形式发布,确保了企业级使用所需的可追溯性和治理能力。用户可通过Hugging Face和IBM Watsonx.ai访问这些模型,并在边缘、本地和浏览器级别部署,帮助早期AI工程师和软件团队更好地推进项目。

(以上内容均由Ai生成)

你可能还想读

48%制造企业用AI提升产出效率

48%制造企业用AI提升产出效率

快速阅读: 据PYMNTS Intelligence报告显示,60家制造、服务与科技企业正应对AI对工作模式的重塑:48%的制造企业聚焦提效,30%的服务企业优化决策,75%的科技公司自认已做好准备。半数企业将设立高阶新岗,技能缺口与运营复 […]

发布时间:2025年12月18日
Warhorse工作室回应Larian使用AI争议

Warhorse工作室回应Larian使用AI争议

快速阅读: 据彭博社报道,Warhorse Studios联合创始人丹尼尔·瓦夫拉呼吁理性看待AI在游戏开发中的应用,称其适用于非核心重复任务以提升效率,但强调《天国:拯救2》未使用AI创作内容,仅用于画质增强,并指出技术变革不可逆,行业应 […]

发布时间:2025年12月18日
Avnet Silica携手DeepX推边缘AI解决方案

Avnet Silica携手DeepX推边缘AI解决方案

快速阅读: 据安富利旗下Silica公司消息,该公司近日与DeepX达成合作,以满足欧洲、中东和非洲地区对高性能、超低功耗边缘AI解决方案的迫切需求。相关技术方案现已面向EMEA客户推出,重点应用于智慧城市、智能制造、自主移动机器人及机器视 […]

发布时间:2025年12月18日
OpenAI计划融资百亿美元估值达7500亿

OpenAI计划融资百亿美元估值达7500亿

快速阅读: 据The Information报道,OpenAI正与投资者磋商新一轮融资,计划募资最多1000亿美元,估值或达7500亿美元,为其2026年下半年潜在IPO铺路。资金将主要用于算力基础设施建设,亚马逊也在洽谈投资100亿美元, […]

发布时间:2025年12月18日
AI自动关停客户账户引发治理风险

AI自动关停客户账户引发治理风险

快速阅读: 据相关报道,Greyhound Research分析师戈吉亚警示,云与AI服务商“静默关停”企业账户正成为新型治理风险,主要源于自动化系统与合同自由裁量权。他指出,全球47%的首席信息官缺乏应对此类突发中断的预案,呼吁企业完善多 […]

发布时间:2025年12月18日
韩国政府2月起向机构分发英伟达GPU

韩国政府2月起向机构分发英伟达GPU

快速阅读: 据韩国科学和信息通信技术部消息,韩国将于2026年2月起分批发放英伟达GPU,支持企业、高校及国家级AI项目,推动国产NPU研发与6G网络建设,目标到2030年构建能效超进口GPU两倍的AI服务器生态,并在全球6G市场占据20% […]

发布时间:2025年12月18日
医院实施人工智能需建立统一标准

医院实施人工智能需建立统一标准

快速阅读: 据美国食品药品监督管理局消息,该机构正推动将特定人工智能软件作为医疗器械纳入上市前审批,以加强医疗AI的安全监管;同时,独立认证机构URAC于2025年推出首个医疗人工智能认证项目,通过全生命周期评估提升工具的公平性、透明度与临 […]

发布时间:2025年12月18日
SMART Busnes发布AI答案引擎优化工具包

SMART Busnes发布AI答案引擎优化工具包

快速阅读: 最新消息显示,威尔士锡尔迪金郡推出“SMART Busnes”数字工具包,由安图尔·凯姆鲁企业主导,聚焦答案引擎优化(AEO),帮助中小企业提升在AI搜索中的可见度。该工具包提供分步指南与AI提示词,获英国共享繁荣基金支持,以缩 […]

发布时间:2025年12月18日