阿里云开源通义DeepResearch,性能媲美OpenAI
快速阅读: 阿里云通义实验室宣布开源通义DeepResearch,该Web代理工具在性能上对标OpenAI,支持128K上下文,适用于多步骤信息搜集任务,已应用于高德地图和法律助手,显著提升效率。
阿里云通义实验室今日宣布,已将通义DeepResearch完全开源。这款开创性的Web代理工具,以300亿参数(实际激活30亿)的轻量级规模,在性能上实现了与OpenAI深度研究工具的对标突破。
通义DeepResearch在多项权威基准测试中表现出色,包括在Humanity’s Last Exam中获得32.9分,在BrowseComp上取得45.3分,并在xbench-DeepSearch中获得75.0的高分,标志着开源AI智能体在复杂信息检索和推理领域取得了重要进展。
该代理工具专为处理多步骤、长期的深度信息搜集任务设计,支持128K的超长上下文。它能高效地将复杂问题分解,进行多步推理,并整合大量数据。其技术创新包括智能体数据的持续预训练和基于策略的强化学习,这使其在处理多轮交互和实时数据处理的场景中,如多日行程规划和法律文档分析,表现出强大的稳定性和可靠性。
通义DeepResearch提供两种推理模式:适用于轻量级任务的单模型ReAct模式,以及通过多Agent并行协作、支持算力扩展的Heavy模式。目前,该技术已在实际应用中落地,例如集成到高德地图,帮助用户规划个性化多日行程;同时,它还赋能法律助手“通义法睿”,显著提高了合同风险评估和案件分析的效率。
作为阿里云通义系列大模型生态的重要组成部分,通义DeepResearch的开源将大幅降低AI代理的开发门槛。该系列此前已开源超过200款不同参数规模的模型,并催生了Hugging Face平台上超过10万个二次开发模型。专家认为,此次开源将为开发者和小型团队提供强大基础,帮助他们快速构建特定领域的AI智能体。
(以上内容均由Ai生成)