IBM 发布边缘 AI 专用 Granite4.0Nano 系列模型

发布时间:2025年11月1日    来源:szf
IBM 发布边缘 AI 专用 Granite4.0Nano 系列模型

快速阅读: IBM发布Granite4.0Nano系列小型模型,专为本地和边缘推理设计,增强企业控制力和开源许可,涵盖8个模型,支持多种运行环境,性能优异,适用于AI工程和软件开发。

近日,IBM AI 团队发布了 Granite4.0Nano 系列,这是一组专为本地和边缘推理设计的小型模型,旨在为企业提供更强的控制力和开源许可。该系列包括8个模型,分为350M和约1B两种规模,采用混合SSM和变换器架构,支持基本和指令两种模式。所有模型均在Apache 2.0许可下发布,并能在vLLM、llama.cpp和MLX等流行运行环境中原生运行。

Granite4.0Nano 系列涵盖四条模型线及其基础版本。其中,Granite4.0H1B采用混合SSM架构,参数量约为1.5B;而Granite4.0H350M同样采用混合方法,参数量为350M。为确保最大的运行时兼容性,IBM还提供了Granite4.01B和Granite4.0350M的变换器版本。

这些H变体模型通过交替使用SSM层和变换器层设计,相比纯变换器在内存增长方面具有显著优势,同时保留了变换器模块的通用性。Granite4.0Nano 模型未采用减少数据管道的方式,而是遵循与大规模Granite4.0模型相同的训练方法,使用超过15万亿个标记进行训练,并经过指令调整,以增强工具使用和指令遵循能力。

IBM还将Granite4.0Nano与Qwen、Gemma和LiquidAI LFM等同类模型进行了对比,结果显示,Granite4.0Nano在通用知识、数学、代码及安全性等领域表现优异。此外,该系列模型在代理任务上也取得了出色成绩,在IFEval和伯克利函数调用排行榜第3版中排名第三。

这些模型经过ISO42001认证,并以加密签名形式发布,确保了企业级使用所需的可追溯性和治理能力。用户可通过Hugging Face和IBM Watsonx.ai访问这些模型,并在边缘、本地和浏览器级别部署,帮助早期AI工程师和软件团队更好地推进项目。

(以上内容均由Ai生成)

你可能还想读

英国民众广泛使用AI理财,Lloyds报告揭示趋势

英国民众广泛使用AI理财,Lloyds报告揭示趋势

快速阅读: 根据劳埃德消费者数字指数,过去一年约2880万英国成人使用AI管理财务,六成用户首选ChatGPT。AI助力投资、债务管理和财务规划,每周至少使用一次者占三成,平均每年节省399英镑。尽管如此,83%的用户担忧数据隐私,80%担 […]

发布时间:2025年11月3日
高通进军AI芯片市场,英伟达面临挑战

高通进军AI芯片市场,英伟达面临挑战

快速阅读: 亚马逊、谷歌和微软等数据中心巨头绕过英伟达,与博通、美满电子科技合作开发定制芯片。谷歌张量处理单元与博通共研,支持多平台,Anthropic成关键用户。 这并非英伟达在人工智能数据中心领域可被超越的唯一证据。像亚马逊、谷歌(隶属 […]

发布时间:2025年11月3日
沙特AI企业获巨额投资,目标成为全球第三大AI基础设施提供商

沙特AI企业获巨额投资,目标成为全球第三大AI基础设施提供商

快速阅读: 沙特阿拉伯利用主权财富基金支持人工智能公司Humain,目标成为全球第三大AI基础设施提供商。Humain与沙特阿美、AirTrunk及高通合作,面临阿联酋竞争和获取美国技术的挑战。 凭借近万亿美元的主权财富基金,沙特阿拉伯正在 […]

发布时间:2025年11月3日
苹果2026年推智能显示器,布局智能家居生态

苹果2026年推智能显示器,布局智能家居生态

快速阅读: 苹果计划2026年3月至4月启动智能家居战略,推出智能显示屏两种版本,与重大AI升级和改进Siri同步,旨在构建智能家居安全生态系统。 苹果在智能家居领域的尝试一直显得有些半生不熟,不是吗?HomePod虽然是一款出色的音箱,但 […]

发布时间:2025年11月3日
AI助力航运业转型,而非取代船员角色

AI助力航运业转型,而非取代船员角色

快速阅读: 全球网络攻击频发,国际航运商会调查指出网络攻击成航运业四大风险之一,引发对AI影响海员职业的担忧。但实际上,AI将通过自动化日常任务提升海员工作效率,而非取代岗位。 近期,全球各行业遭遇的网络攻击数量急剧增加。国际航运商会的最新 […]

发布时间:2025年11月3日
Getty Images与Perplexity合作,AI助力重塑竞争优势

Getty Images与Perplexity合作,AI助力重塑竞争优势

快速阅读: Perplexity与Getty Images达成全球许可协议,整合后者图片至AI搜索工具,提升用户体验,强调版权重要性。此合作可能重塑Getty投资前景,但AI法律风险犹存。 2025年10月31日,Perplexity宣布与 […]

发布时间:2025年11月3日
电子信息技术部计划出台新规,严管深度伪造与合成内容

电子信息技术部计划出台新规,严管深度伪造与合成内容

快速阅读: 电子信息技术部计划出台新法,规范深度伪造与合成内容,涵盖AI全领域,要求内容标注和验证,主要社交媒体平台需承担额外责任。 电子信息技术部(MeitY)计划出台新法律,以规范深度伪造和合成内容。该法律将涵盖人工智能及其应用的所有方 […]

发布时间:2025年11月3日
OpenAI CEO驳斥营收质疑,称公司收入远超130亿美元

OpenAI CEO驳斥营收质疑,称公司收入远超130亿美元

快速阅读: OpenAI CEO Sam Altman在播客中透露,公司年收入远超130亿美元,未来十年计划投资超1万亿美元于计算基础设施。面对资金质疑,Altman表示收入正快速增长,并不排除上市可能性。 近日,OpenAI首席执行官Sa […]

发布时间:2025年11月3日