IBM发布Granite4.0Nano系列,专为边缘AI设计

发布时间:2025年10月30日    来源:szf
IBM发布Granite4.0Nano系列,专为边缘AI设计

快速阅读: IBM发布Granite4.0Nano系列,含8个专为边缘和本地推理设计的模型,基于15万亿标记训练,支持多种运行环境,获ISO42001认证,提升企业控制力和开源许可。

近日,IBM AI团队发布了Granite4.0Nano系列,这是一组专为本地和边缘推理设计的小型模型,旨在为企业提供更强的控制力和开源许可。该系列包含8个模型,分为350M和约1B两种规模,采用混合SSM和变换器架构,支持基本和指令两种模式,所有模型均在Apache 2.0许可下发布,并能在vLLM、llama.cpp和MLX等流行运行环境中直接运行。

Granite4.0Nano系列涵盖四条模型线及其基础版本。其中,Granite4.0H1B采用混合SSM架构,参数量约为1.5B;而Granite4.0H350M同样采用混合架构,参数量为350M。为了确保最大的运行时兼容性,IBM还提供了Granite4.01B和Granite4.0350M的变换器版本。

这些H变体模型通过交替使用SSM层和变换器层设计,相比纯变换器模型,在内存增长方面展现出明显优势,同时保持了变换器模块的通用性。Granite4.0Nano模型未采用减少数据管道的方法,而是遵循与大规模Granite4.0模型相同的训练方法,使用超过15万亿个标记进行训练,并经过指令调整,提高了工具使用和指令遵循能力。

IBM还将Granite4.0Nano与其他类似模型进行了对比,如Qwen、Gemma和LiquidAI LFM,结果显示其在通用知识、数学、代码及安全性等方面的表现显著提升。此外,该系列模型在代理任务上的表现也十分出色,在IFEval和伯克利函数调用排行榜第3版中排名第三。

这些模型已通过ISO42001认证,并以加密签名形式发布,确保了企业级使用所需的可追溯性和治理能力。用户可通过Hugging Face和IBM Watsonx.ai访问这些模型,并在边缘、本地和浏览器级别部署,助力早期AI工程师和软件团队更好地推进项目。

Hugging Face链接: https://huggingface.co/collections/ibm-granite/granite-40-nano-language-models

要点总结:

– IBM发布了Granite4.0Nano系列,包含8个模型,适用于边缘AI推理。

– 该系列模型基于超过15万亿个标记进行训练,确保了性能的继承性。

– 所有模型均通过ISO42001认证,具备企业级治理能力,支持多种运行环境。

(以上内容均由Ai生成)

你可能还想读

韦氏词典年度词汇嘲讽AI垃圾内容

韦氏词典年度词汇嘲讽AI垃圾内容

快速阅读: 据韦氏词典报道,2025年“AI slop”一词被广泛用于指代低质、冗余的AI生成内容,如虚假新闻和劣质广告图像。该词带有戏谑贬义,强调盲目量产而非提升质量,区别于AI在编程等领域的有效应用。 2025年12月16日,随着人工智 […]

发布时间:2025年12月16日
Tiiny推口袋AI超算,离线运行大模型

Tiiny推口袋AI超算,离线运行大模型

快速阅读: 据Tiiny消息,该公司近日推出AI Pocket Lab微型计算机,可在无网、无独显条件下本地运行百亿至千亿参数大模型,整机功耗低于65瓦,获吉尼斯认证为最小同类设备之一。 美国初创企业Tiiny近日推出AI Pocket L […]

发布时间:2025年12月16日
TikTok推新工具识别AI生成内容

TikTok推新工具识别AI生成内容

快速阅读: 据TikTok消息,平台正部署AI生成内容识别技术,通过嵌入不可见数字水印追踪经剪辑或转发的AI视频,并在界面增设推荐调节滑块,允许用户优化内容偏好,提升透明度与体验,该体系已在部分市场逐步上线。 TikTok正加强技术手段,以 […]

发布时间:2025年12月16日
AI助研团队阻断病毒入侵

AI助研团队阻断病毒入侵

快速阅读: 据业内消息,科研团队在《纳米尺度》期刊发表研究,利用AI与分子模拟发现病毒融合蛋白的关键相互作用,干预后可阻断病毒入侵细胞,为抗病毒药物研发提供新靶点和机制解析。 一项研究于11月发表在《纳米尺度》(Nanoscale)期刊上, […]

发布时间:2025年12月16日
AI智能体上演社交媒体真人秀

AI智能体上演社交媒体真人秀

快速阅读: 截至本周,据开发者哈珀·里德团队实验发现,AI智能体在社交平台自发掌握“暗讽”行为,能针对其他智能体发布隐晦批评,其互动模式高度拟人,引发对AI自主交互伦理与监管机制的广泛关注。 近日,开发者哈珀·里德带领团队开展了一项人工智能 […]

发布时间:2025年12月16日
英伟达收购AI开发商加码开源布局

英伟达收购AI开发商加码开源布局

快速阅读: 据英伟达消息,该公司近日收购开源作业调度系统开发商SchedMD,以强化其在AI软件生态布局。Slurm系统广泛用于大模型训练任务管理,收购后将继续开源分发,并已适配英伟达最新硬件,助力其应对全球竞争。 英伟达近日宣布收购人工智 […]

发布时间:2025年12月16日
TikTok重组全球电商团队提升AI协作效率

TikTok重组全球电商团队提升AI协作效率

快速阅读: 据机构披露,字节跳动近日重组TikTok全球电商与数据科学团队,旨在强化AI协作与运营效率;美国电商业务在“黑五”期间销售额突破5亿美元,政治禁令风险亦有所缓解。 近日,字节跳动对旗下TikTok全球电商产品与数据科学团队进行了 […]

发布时间:2025年12月16日
Reddit用户总结AI写作的6个明显特征

Reddit用户总结AI写作的6个明显特征

快速阅读: 截至发稿时,人工智能生成文本过度依赖“相比之下”“因此”等程式化连接词,影响简洁性与阅读体验,专家正研究优化模型表达方式以减少机械重复。 人工智能在生成文本时,常借助大量提示性词语和短语来增强行文连贯性。例如,“相比之下”“因此 […]

发布时间:2025年12月16日