谷歌推Gemini API,精准解析网页内容
快速阅读: 谷歌推出Gemini API URL Context功能,可在Google AI Studio使用,支持34MB内容解析,涵盖多种格式。此功能简化开发者操作,提升信息提取效率,但无法处理付费墙后内容。
近日,谷歌正式推出了其全新的Gemini API URL Context功能,旨在赋予AI如同人类般的网页理解能力。该功能于5月28日在Google AI Studio上线,标志着谷歌在AI技术领域再次取得重大突破。
与常规的链接分享方式不同,URL Context功能的运行机制独特。通常,将链接发送给AI时,AI仅通过简单的浏览器工具或搜索引擎插件读取网页内容,这种方法往往只能获取到网页的摘要或部分内容。而Gemini的URL Context则是专为开发者设计的API,能够精确解析并理解网页上的所有内容,甚至支持PDF、图片等多种格式的信息。
具体而言,URL Context功能可处理高达34MB的网页内容,支持HTML、JSON、CSV等多种文件格式。谷歌产品负责人Logan Kilpatrick表示,这项功能大幅简化了开发者的操作流程,只需几行代码即可实现深度信息提取与处理。与传统的“检索-增强生成”(RAG)流程相比,URL Context省去了复杂的步骤,无需额外的内容提取、向量存储及检索机制。
该功能的强大之处在于,通过一个简单的URL,Gemini能够从特斯拉的财报中提取关键数据,如“总资产”和“总负债”,这些信息通常难以通过传统方法获得。此外,它还能识别PDF中的复杂结构,包括表格和脚注。这使得开发者能够更快、更准确地获取所需信息,显著提升了工作效率。
然而,URL Context也存在局限。它无法穿透付费墙,对于需要登录才能访问的内容无能为力。此外,它不处理专用工具(如YouTube视频和Google Docs等)中的内容。内容处理费用按Token数量计算,因此开发者需合理选择信息源,以控制成本。
URL Context功能不仅展示了AI技术的发展趋势,也为未来的信息检索方式提供了新的视角。
(以上内容均由Ai生成)