Gemma 3n 可与 RAG 和函数调用库一起用于设备上推理

发布时间:2025年5月30日    来源:szf
Gemma 3n 可与 RAG 和函数调用库一起用于设备上推理

快速阅读: 据《InfoQ 公司》最新报道,谷歌推出多模态小型语言模型Gemma 3n,支持文本、图像、视频和音频输入,提供2B和4B参数变体。同时发布AI边缘设备功能调用SDK及AI边缘RAG库,开发者可微调模型或使用RAG增强应用数据。相关工具已在Android平台上线,未来扩展至其他平台。

谷歌宣布,Gemma 3n 已在最新推出的轻量级实时 Hugging Face 社区中提供预览版,并与许多之前发布的模型一同上线。Gemma 3n 是一款支持文本、图像、视频和音频输入的多模态小型语言模型。它还支持通过检索增强生成(RAG)进行微调以及利用新的 AI 边缘 SDK 进行功能调用。根据谷歌,Gemma 3n 提供两种参数变体:Gemma 3n 2B 和 Gemma 3n 4B,两者均支持文本和图像输入,音频支持即将推出。这标志着相比今年早些时候发布的非多模态 Gemma 3 1B(其处理速度可达每秒 2,585 个标记,仅需 529MB 内存)有了显著增长。谷歌指出,Gemma 3n 使用选择性参数激活,这是一种高效的参数管理方法。这意味着这两个模型包含的参数比在推理过程中活跃的 2B 或 4B 参数更多。

谷歌强调了开发人员可以对基础模型进行微调,并使用通过 Google AI Edge 提供的新量化工具进行转换和量化的可能性。作为微调的替代方案,这些模型可以在本地检索增强生成(RAG)中使用,以增强特定应用的数据语言模型。此功能由 AI 边缘 RAG 库驱动,目前仅在 Android 上可用,未来将在其他平台上推出。RAG 库使用一个包括数据导入、分块和索引、嵌入生成、信息检索和使用 LLM 生成响应的简单管道。它允许对 RAG 管道进行全面定制,包括支持自定义数据库、分块策略和检索函数。

除了 Gemma 3n,谷歌还宣布了 AI 边缘设备功能调用 SDK,目前也仅在 Android 上可用。该 SDK 能使模型调用特定功能以执行现实世界中的操作。要将大型语言模型与外部功能集成,您可以通过指定功能名称、描述(以指导 LLM 在何时使用该功能)以及所需参数来描述功能。此元数据被放入一个工具对象中,并通过生成模型构造函数传递给大型语言模型。功能调用 SDK 包括基于您提供的描述接收来自 LLM 的功能调用并发送执行结果回 LLM 的支持。

如果您想更详细地了解这些新工具,最好的起点是谷歌 AI 边缘画廊,这是一款展示多种模型并支持文本、图像和音频处理的实验性应用。

**关于作者**
塞尔吉奥·德·西莫内

以上内容经过整理与润色,力求更加通顺流畅。

(以上内容均由Ai生成)

你可能还想读

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

美国能源部 17 个国家实验室全景及创世纪计划战略布局分析

快速阅读: 美国能源部17个国家实验室构成顶尖科研体系,在基础科学、能源安全、气候变化等领域发挥关键作用。拥有全球领先的超算资源及顶尖人才,年经费约220亿美元。随着“创世纪计划”启动,实验室将形成协同网络,推动美国在清洁能源、量子计算等前 […]

发布时间:2025年12月8日
谷歌Gemini 3 Pro发布

谷歌Gemini 3 Pro发布

快速阅读: 谷歌发布新一代推理模型Gemini 3 Pro,显著提升数学、编程和视觉理解能力。一经发布,Gemini 3 Pro几乎横扫各大评测榜单,在LMArena大模型竞技场中以1501的Elo得分高居榜首。在MathArena数学竞赛 […]

发布时间:2025年11月19日
独具创新,直击痛点:深度解析华为十大最新方案

独具创新,直击痛点:深度解析华为十大最新方案

快速阅读: 第三个方案,是华为的U6GHzAAU天线。综合来看,华为的U6GAAU,真正实现了容量覆盖双优,助力全球U6G商用。LampSiteX,是LampSite系列的最新型号。第五个方案,是华为有源天线产品——EasyAAU。Easy […]

发布时间:2025年11月13日
Palantir估值承压仍领跑AI赛道

Palantir估值承压仍领跑AI赛道

快速阅读: 近期,美国AI概念股整体承压,Palantir与英伟达遭遇做空传闻,引发市场短暂震荡。然而,在宏观调整与估值质疑中,Palantir仍凭借强劲业绩与差异化AI布局维持长期增长势头。分析人士认为,该公司正处于由“政府数据支撑”向“ […]

发布时间:2025年11月12日
Palantir与Snowflakes深化AI合作

Palantir与Snowflakes深化AI合作

快速阅读: Snowflake 与 Palantir 宣布建立战略合作,整合双方的数据与AI能力,使企业能够在统一的数据基础上直接调用 Palantir 的AI分析与智能应用工具,加速企业级AI落地。 2025年10月,Snowflake […]

发布时间:2025年11月10日
Palantir与迪拜控股共建AI公司

Palantir与迪拜控股共建AI公司

快速阅读: Dubai Holding 与 Palantir 宣布成立合资公司 Aither,致力于为中东地区政府与企业提供人工智能转型解决方案。该合作标志着 Palantir 在中东技术布局的进一步深化,也为当地公共服务与产业数字化提供新 […]

发布时间:2025年11月10日
Palantir携手Lumen共建企业AI平台

Palantir携手Lumen共建企业AI平台

快速阅读: 2025年10月,Palantir Technologies与Lumen Technologies宣布达成战略合作,联合打造面向企业级应用的人工智能服务平台。双方将以Palantir的Foundry与AIP平台为核心,推动通信与 […]

发布时间:2025年11月7日
Palantir携手Hadean拓展英国国防部AI战场模拟平台

Palantir携手Hadean拓展英国国防部AI战场模拟平台

快速阅读: 2025年10月,数据智能公司 Palantir Technologies 宣布与英国分布式计算企业 Hadean 达成战略合作,双方将共同为英国国防部(UK Ministry of Defence, UK MoD)扩展基于人工 […]

发布时间:2025年11月7日