阿里云开源通义DeepResearch，性能媲美OpenAI

发布时间：2025年9月17日来源：szf

快速阅读: 阿里云通义实验室宣布开源通义DeepResearch，该Web代理工具在性能上对标OpenAI，支持128K上下文，适用于多步骤信息搜集任务，已应用于高德地图和法律助手，显著提升效率。

阿里云通义实验室今日宣布，已将通义DeepResearch完全开源。这款开创性的Web代理工具，以300亿参数（实际激活30亿）的轻量级规模，在性能上实现了与OpenAI深度研究工具的对标突破。

通义DeepResearch在多项权威基准测试中表现出色，包括在Humanity’s Last Exam中获得32.9分，在BrowseComp上取得45.3分，并在xbench-DeepSearch中获得75.0的高分，标志着开源AI智能体在复杂信息检索和推理领域取得了重要进展。

该代理工具专为处理多步骤、长期的深度信息搜集任务设计，支持128K的超长上下文。它能高效地将复杂问题分解，进行多步推理，并整合大量数据。其技术创新包括智能体数据的持续预训练和基于策略的强化学习，这使其在处理多轮交互和实时数据处理的场景中，如多日行程规划和法律文档分析，表现出强大的稳定性和可靠性。

通义DeepResearch提供两种推理模式：适用于轻量级任务的单模型ReAct模式，以及通过多Agent并行协作、支持算力扩展的Heavy模式。目前，该技术已在实际应用中落地，例如集成到高德地图，帮助用户规划个性化多日行程；同时，它还赋能法律助手“通义法睿”，显著提高了合同风险评估和案件分析的效率。

作为阿里云通义系列大模型生态的重要组成部分，通义DeepResearch的开源将大幅降低AI代理的开发门槛。该系列此前已开源超过200款不同参数规模的模型，并催生了Hugging Face平台上超过10万个二次开发模型。专家认为，此次开源将为开发者和小型团队提供强大基础，帮助他们快速构建特定领域的AI智能体。

(以上内容均由Ai生成)