谷歌推Gemini API，精准解析网页内容

发布时间：2025年9月2日来源：szf

快速阅读: 谷歌推出Gemini API URL Context功能，可在Google AI Studio使用，支持34MB内容解析，涵盖多种格式。此功能简化开发者操作，提升信息提取效率，但无法处理付费墙后内容。

近日，谷歌正式推出了其全新的Gemini API URL Context功能，旨在赋予AI如同人类般的网页理解能力。该功能于5月28日在Google AI Studio上线，标志着谷歌在AI技术领域再次取得重大突破。

与常规的链接分享方式不同，URL Context功能的运行机制独特。通常，将链接发送给AI时，AI仅通过简单的浏览器工具或搜索引擎插件读取网页内容，这种方法往往只能获取到网页的摘要或部分内容。而Gemini的URL Context则是专为开发者设计的API，能够精确解析并理解网页上的所有内容，甚至支持PDF、图片等多种格式的信息。

具体而言，URL Context功能可处理高达34MB的网页内容，支持HTML、JSON、CSV等多种文件格式。谷歌产品负责人Logan Kilpatrick表示，这项功能大幅简化了开发者的操作流程，只需几行代码即可实现深度信息提取与处理。与传统的“检索-增强生成”（RAG）流程相比，URL Context省去了复杂的步骤，无需额外的内容提取、向量存储及检索机制。

该功能的强大之处在于，通过一个简单的URL，Gemini能够从特斯拉的财报中提取关键数据，如“总资产”和“总负债”，这些信息通常难以通过传统方法获得。此外，它还能识别PDF中的复杂结构，包括表格和脚注。这使得开发者能够更快、更准确地获取所需信息，显著提升了工作效率。

然而，URL Context也存在局限。它无法穿透付费墙，对于需要登录才能访问的内容无能为力。此外，它不处理专用工具（如YouTube视频和Google Docs等）中的内容。内容处理费用按Token数量计算，因此开发者需合理选择信息源，以控制成本。

URL Context功能不仅展示了AI技术的发展趋势，也为未来的信息检索方式提供了新的视角。

(以上内容均由Ai生成)