IBM 发布边缘 AI 专用 Granite4.0Nano 系列模型

发布时间:2025年11月1日    来源:szf
IBM 发布边缘 AI 专用 Granite4.0Nano 系列模型

快速阅读: IBM发布Granite4.0Nano系列小型模型,专为本地和边缘推理设计,增强企业控制力和开源许可,涵盖8个模型,支持多种运行环境,性能优异,适用于AI工程和软件开发。

近日,IBM AI 团队发布了 Granite4.0Nano 系列,这是一组专为本地和边缘推理设计的小型模型,旨在为企业提供更强的控制力和开源许可。该系列包括8个模型,分为350M和约1B两种规模,采用混合SSM和变换器架构,支持基本和指令两种模式。所有模型均在Apache 2.0许可下发布,并能在vLLM、llama.cpp和MLX等流行运行环境中原生运行。

Granite4.0Nano 系列涵盖四条模型线及其基础版本。其中,Granite4.0H1B采用混合SSM架构,参数量约为1.5B;而Granite4.0H350M同样采用混合方法,参数量为350M。为确保最大的运行时兼容性,IBM还提供了Granite4.01B和Granite4.0350M的变换器版本。

这些H变体模型通过交替使用SSM层和变换器层设计,相比纯变换器在内存增长方面具有显著优势,同时保留了变换器模块的通用性。Granite4.0Nano 模型未采用减少数据管道的方式,而是遵循与大规模Granite4.0模型相同的训练方法,使用超过15万亿个标记进行训练,并经过指令调整,以增强工具使用和指令遵循能力。

IBM还将Granite4.0Nano与Qwen、Gemma和LiquidAI LFM等同类模型进行了对比,结果显示,Granite4.0Nano在通用知识、数学、代码及安全性等领域表现优异。此外,该系列模型在代理任务上也取得了出色成绩,在IFEval和伯克利函数调用排行榜第3版中排名第三。

这些模型经过ISO42001认证,并以加密签名形式发布,确保了企业级使用所需的可追溯性和治理能力。用户可通过Hugging Face和IBM Watsonx.ai访问这些模型,并在边缘、本地和浏览器级别部署,帮助早期AI工程师和软件团队更好地推进项目。

(以上内容均由Ai生成)

你可能还想读

英伟达与法雷奥就自动驾驶代码窃密案达成和解

英伟达与法雷奥就自动驾驶代码窃密案达成和解

快速阅读: 12月18日消息,英伟达与法雷奥就自动驾驶商业秘密诉讼达成和解。该案源于一名前法雷奥工程师跳槽后被指携带源代码,涉事员工已在德国定罪。同时,谷歌正加速推进TorchTPU项目,以提升TPU对PyTorch的兼容性,削弱英伟达在A […]

发布时间:2025年12月18日
美国天气模型升级AI系统

美国天气模型升级AI系统

快速阅读: 据美国国家海洋和大气管理局消息,该局近日推出AI升级版全球预报系统(AIGFS),在保持预报质量的同时,将计算资源消耗降至原系统的0.3%,并成功模拟12月10日影响美国西北太平洋的“大气河”强降水事件,显著提升极端天气预警能力 […]

发布时间:2025年12月18日
德州太平洋土地公司携手Bolt推进AI数据中心建设

德州太平洋土地公司携手Bolt推进AI数据中心建设

快速阅读: 截至报道时,德克萨斯太平洋土地公司与AI基建企业Bolt Data & Energy达成合作,计划在西得克萨斯开发大型数据中心园区,受此推动,公司股价收涨5.6%。该公司将出资5000万美元换取股权及优先供水权,以依托当 […]

发布时间:2025年12月18日
Steam平台陷AI误判风波

Steam平台陷AI误判风波

快速阅读: 据Positive Concept Games消息,其开发的独立游戏《神龛的遗产》因被误指使用AI技术遭差评,公司澄清所有内容均为人工创作,未采用生成式AI。尽管评价已回升至“特别好评”,事件仍引发对Steam评论生态及AI标签 […]

发布时间:2025年12月18日
苹果借内存效率构筑新优势

苹果借内存效率构筑新优势

快速阅读: 受存储芯片价格波动影响,中小厂商承压。苹果凭借成本调控与规模效应,计划明年推出低价Mac和iPhone;其自研芯片还将强化端侧AI能力,凸显性价比与隐私优势。 受存储芯片价格波动影响,中小厂商在制造成本端承压,同时还要在利润空间 […]

发布时间:2025年12月18日
企业加速治理“影子AI”风险

企业加速治理“影子AI”风险

快速阅读: 据行业统计,企业在加速AI应用落地的同时,“影子AI”因合规流程迟滞已蔓延至工作全流程,引发数据泄露与算法偏见等风险;专家建议通过自动化智能监管实现高效治理,以AI治理AI,推动合规与业务协同发展。 当前,企业在加速推进人工智能 […]

发布时间:2025年12月18日
亚马逊拟投100亿美元换OpenAI采用其AI芯片

亚马逊拟投100亿美元换OpenAI采用其AI芯片

快速阅读: 据最新通报,亚马逊正就向OpenAI投资最高100亿美元进行谈判,并将开放自研Trainium AI芯片的使用权,以深化双方在人工智能领域的合作。若交易达成,双方将通过云基础设施绑定强化技术协同,凸显大型云服务商在AI生态中的战 […]

发布时间:2025年12月18日
Hut 8获70亿美元AI数据中心租约

Hut 8获70亿美元AI数据中心租约

快速阅读: 据媒体报道,北美比特币矿企Hut 8签署一份70亿美元、为期15年的协议,将其位于路易斯安那州的园区转为AI数据中心。Fluidstack将承租其中245兆瓦容量,并获得谷歌担保,预计年均收入达4.54亿美元,推动公司股价盘前上 […]

发布时间:2025年12月18日