Google 推出 Gemini 文件搜索工具,简化私有 RAG 集成
快速阅读: Google 推出 Gemini API 文件搜索工具,实现私有文件无缝转化为知识库,支持多格式文件,提供一站式 RAG 流程,显著降低开发门槛,查询免费,首次索引费用低至 0.15 美元/百万词元。
Google 今日正式推出了 Gemini API 中的“文件搜索工具”,这是一个完全托管的 RAG 系统。该工具能够将私有文件无缝转化为 Gemini 的知识库,用户无需自行处理数据分块、嵌入生成或向量存储等复杂步骤,只需通过 API 集成就可实现高效的检索与生成。
文件搜索工具的核心功能是一站式的 RAG 流程。它集成了文件上传、索引和检索的全过程,使用 Google 的 Gemini Embedding 模型(gemini-embedding-001)生成高质量的向量表示,支持语义搜索而非简单的关键词匹配。这使得开发者可以专注于应用逻辑,而无需关心底层基础设施的维护。
根据 Google 官方博客的介绍,该工具支持多种常见的文件格式,包括 PDF、DOCX、TXT、JSON 以及各种编程语言文件(如 Python、Java 等源代码)。用户只需通过 Gemini API 的 generateContent 接口调用,即可将私有文档导入知识库。系统会智能分块数据,确保检索结果的上下文连贯性,并在响应中自动生成引用链接,直接指向文档的具体部分,从而提高输出的透明度和可验证性。
这一设计特别适用于企业级场景,例如内部知识助手、智能支持机器人或内容发现平台。Google 强调,对于海量数据、频繁更新、重复查询或需要严格可追溯性的应用,该工具能显著降低开发门槛,提供可扩展的性能支持。
此外,文件搜索工具采用了创新的计费模式:查询完全免费,首次索引的费用低至 0.15 美元/百万词元。与传统的 RAG 解决方案不同,该工具在查询期间的存储和嵌入生成均不收费,仅在首次索引文件时收取嵌入生成费用,该费用基于词元(token)计算,使用 gemini-embedding-001 模型的标准费率是每百万词元 0.15 美元。这使得工具在成本控制方面更具竞争力,特别适合大规模部署和实验性项目。Google 产品经理在公告中指出:“这一计费模式大幅降低了 RAG 实现的入门门槛和运营成本,有助于开发者更快地将 AI 落地。” 后续文件更新或增量索引将仅按实际变化部分计费,进一步优化了资源利用效率。
(以上内容均由Ai生成)