Gemma 3n 可与 RAG 和函数调用库一起用于设备上推理

发布时间:2025年5月30日    来源:szf
Gemma 3n 可与 RAG 和函数调用库一起用于设备上推理

快速阅读: 据《InfoQ 公司》最新报道,谷歌推出多模态小型语言模型Gemma 3n,支持文本、图像、视频和音频输入,提供2B和4B参数变体。同时发布AI边缘设备功能调用SDK及AI边缘RAG库,开发者可微调模型或使用RAG增强应用数据。相关工具已在Android平台上线,未来扩展至其他平台。

谷歌宣布,Gemma 3n 已在最新推出的轻量级实时 Hugging Face 社区中提供预览版,并与许多之前发布的模型一同上线。Gemma 3n 是一款支持文本、图像、视频和音频输入的多模态小型语言模型。它还支持通过检索增强生成(RAG)进行微调以及利用新的 AI 边缘 SDK 进行功能调用。根据谷歌,Gemma 3n 提供两种参数变体:Gemma 3n 2B 和 Gemma 3n 4B,两者均支持文本和图像输入,音频支持即将推出。这标志着相比今年早些时候发布的非多模态 Gemma 3 1B(其处理速度可达每秒 2,585 个标记,仅需 529MB 内存)有了显著增长。谷歌指出,Gemma 3n 使用选择性参数激活,这是一种高效的参数管理方法。这意味着这两个模型包含的参数比在推理过程中活跃的 2B 或 4B 参数更多。

谷歌强调了开发人员可以对基础模型进行微调,并使用通过 Google AI Edge 提供的新量化工具进行转换和量化的可能性。作为微调的替代方案,这些模型可以在本地检索增强生成(RAG)中使用,以增强特定应用的数据语言模型。此功能由 AI 边缘 RAG 库驱动,目前仅在 Android 上可用,未来将在其他平台上推出。RAG 库使用一个包括数据导入、分块和索引、嵌入生成、信息检索和使用 LLM 生成响应的简单管道。它允许对 RAG 管道进行全面定制,包括支持自定义数据库、分块策略和检索函数。

除了 Gemma 3n,谷歌还宣布了 AI 边缘设备功能调用 SDK,目前也仅在 Android 上可用。该 SDK 能使模型调用特定功能以执行现实世界中的操作。要将大型语言模型与外部功能集成,您可以通过指定功能名称、描述(以指导 LLM 在何时使用该功能)以及所需参数来描述功能。此元数据被放入一个工具对象中,并通过生成模型构造函数传递给大型语言模型。功能调用 SDK 包括基于您提供的描述接收来自 LLM 的功能调用并发送执行结果回 LLM 的支持。

如果您想更详细地了解这些新工具,最好的起点是谷歌 AI 边缘画廊,这是一款展示多种模型并支持文本、图像和音频处理的实验性应用。

**关于作者**
塞尔吉奥·德·西莫内

以上内容经过整理与润色,力求更加通顺流畅。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日