谷歌开放最强AI研究代理
快速阅读: 据谷歌消息,该公司近日向开发者开放升级版“深度研究”智能体,基于Gemini 3 Pro模型,可自主执行多轮复杂研究任务并减少幻觉。同时推出开源评测基准DeepSearchQA及新版交互API,推动AI从问答向自主推理演进。
谷歌正加速推进能力更强、自主性更高的AI系统,并首次向开发者开放其核心工具。近日,该公司推出升级版“深度研究”(Deep Research)智能体,供开发者集成至自有应用与工作流中。
该智能体基于谷歌当前最先进的多模态模型Gemini 3 Pro,专为处理复杂、长周期的研究任务而设计,而非仅提供即时简答。其运作方式类似人类研究员:主动提出问题、扫描信息、识别知识缺口,并通过多轮迭代形成严谨结论。谷歌表示,这种闭环自检机制有助于减少幻觉,提升长篇分析的可靠性。
“深度研究”最初于2024年底在Gemini应用内上线,现已走出谷歌生态。开发者可将其嵌入内部工具或产品,打造持续可用的研究助手。据谷歌内部测试,在跨领域、多步骤查询任务中,该智能体表现优于基于同一模型的标准网页搜索模式。公司强调,系统虽非万无一失,但特别适用于探索陌生或结构复杂的议题。
同期发布的还有开源评测基准DeepSearchQA,聚焦AI在多步推理中的连贯性与完整性。该基准包含900项“因果链”任务,覆盖政策、历史、气候科学和健康等17个领域,区别于仅考察孤立事实的传统评测。
面向开发者,“深度研究”API提供PDF与CSV解析、结构化报告模板、细粒度来源引用及JSON格式输出,便于系统集成。未来更新将支持原生图表生成,并扩展对模型上下文协议的支持,允许接入自有数据源。
此外,谷歌还推出新版交互API,以有状态、会话式接口取代旧有的请求-响应模式。该API已在Google AI Studio开放公测,支持长时间运行任务、后台执行及持久上下文管理,为构建更自主的AI代理奠定基础。
上述举措表明,谷歌AI战略重心正从单纯文本生成转向构建具备推理、调研与一定独立运行能力的系统。通过开放工具与设立评测标准,谷歌意在推动AI从“回答问题”迈向“提出更好问题”的新阶段。
(以上内容均由Ai生成)
引用自:印度经济时报