谷歌发布EmbeddingGemma：高效移动文本嵌入模型

发布时间：2025年9月8日来源：szf

快速阅读: 谷歌推出专为移动设备设计的开源嵌入模型EmbeddingGemma，拥有308百万参数，被评为500M以下最佳多语言模型，支持RAG和语义搜索，离线运行，兼容多种工具，适用于聊天机器人和文件搜索等场景。

谷歌深度学习团队正式推出了专为移动设备设计的开源嵌入模型——EmbeddingGemma。该模型拥有308百万个参数，在MTEB（大规模文本嵌入基准）中被评为500M以下的最佳多语言文本嵌入模型，展示了强大的功能，如检索增强生成（RAG）和语义搜索，且能在没有互联网连接的情况下直接在手机等设备上运行。

EmbeddingGemma的优势在于，其性能可与几乎两倍大小的热门模型相媲美。它不仅体积小、灵活性高，适用于多种场景，支持从768到128的可定制输出维度，并具备2000个上下文令牌窗口，可在手机、笔记本电脑和桌面等日常设备上运行。此外，它还兼容多种流行工具，用户可以轻松与sentence-transformers、MLX、Ollama等工具协作。

在构建RAG管道时，EmbeddingGemma表现突出，能生成文本的嵌入，即把文本转换为高维空间的数字表示形式，以反映其意义。在RAG管道中，首先根据用户输入生成嵌入，然后计算其与系统中所有文档嵌入的相似度，从而检索出最相关的文字段落。这种高质量的嵌入确保了最终生成的回答既准确又上下文相关。

此外，EmbeddingGemma在速度和资源消耗方面也经过精心设计，具有小巧、快速和高效的特点。其嵌入推理时间少于15毫秒，支持实时交互。其离线功能确保了用户数据的安全，特别适合开发基于移动设备的应用程序。

开发者现在可以利用EmbeddingGemma实现个性化的聊天机器人、文件搜索，或针对特定领域进行快速微调。无论是离线应用，还是需要高效性能的服务器端应用，EmbeddingGemma都提供了理想的选择。

官方博客链接：https://developers.googleblog.com/en/introducing-embeddinggemma/

(以上内容均由Ai生成)