微软发布Agent Lightning,强化学习优化多代理系统性能

发布时间:2025年10月30日    来源:szf
微软发布Agent Lightning,强化学习优化多代理系统性能

快速阅读: 微软发布 Agent Lightning 开源框架,通过强化学习优化多代理系统,无需改动现有架构。该框架将代理形式化为部分可观测的马尔可夫决策过程,提高大规模语言模型性能。实验显示,在多项任务中实现稳定性能提升。

近日,微软发布了名为 Agent Lightning 的开源框架,旨在通过强化学习(RL)技术优化多代理系统。此框架能够在不改动现有代理架构的前提下,将实际代理行为转化为强化学习过渡,进而提高大规模语言模型(LLM)的性能。

Agent Lightning 将代理视为决策过程的一部分,具体而言,它将代理形式化为部分可观测的马尔可夫决策过程。其中,代理的观察基于当前输入,其行动则涉及模型调用,而奖励可以是终极奖励或中间奖励。框架从代理模型中提取调用记录及输入、输出和奖励信息,去除多余噪声,生成用于训练的高质量过渡数据。

该框架采用了“训练代理解耦”的设计理念,由 Lightning Server 负责训练和服务,提供与 OpenAI 兼容的 API 接口,方便调用更新后的模型。Lightning Client 则在现有代理运行时捕捉调用记录,并实时传输至服务器。这种设计不仅维持了工具、浏览器等组件的紧密集成,还将 GPU 训练集中于服务器层面。

Agent Lightning 提供了两种追踪路径。默认路径利用 OpenTelemetry 收集数据,便于将代理的遥测信息发送到标准收集器。另一种则是轻量级的内嵌追踪器,适用于不希望部署 OpenTelemetry 的团队。所有收集的数据最终统一存储,以备训练使用。

在实验测试中,研究团队选取了三个任务来评估 Agent Lightning 的效果,分别是文本转 SQL、检索增强生成和数学问答。文本转 SQL 任务使用了 Spider 基准,涵盖了超过10,000个问题和200个数据库。检索增强生成任务基于包含2100万文档的维基百科规模索引,使用 MuSiQue 基准。数学问答任务则采用 Calc X 数据集,通过工具调用来完成计算。实验结果显示,在所有任务中,Agent Lightning 均实现了稳定的奖励增长。

论文链接:https://arxiv.org/abs/2508.03680v1

要点:

– Agent Lightning 是一个开源框架,可在不重构建现有系统的基础上优化多代理系统。

– 该框架将代理视为部分可观测的马尔可夫决策过程,能够生成高质量的训练数据。

– 实验表明,Agent Lightning 在文本转 SQL、检索增强生成和数学问答等任务中显著提升了性能。

(以上内容均由Ai生成)

你可能还想读

斐济喜来登酒店推出AI虚拟礼宾Koko

斐济喜来登酒店推出AI虚拟礼宾Koko

快速阅读: 据业内消息,斐济喜来登高尔夫海滩度假村近日上线AI虚拟礼宾“Koko”,宾客扫码即可查询圣诞活动、预订餐厅并获取实时信息,此举每年可减少纸张消耗,相当于保护50棵树,同时提升服务效率与互动体验。 斐济喜来登高尔夫海滩度假村近日推 […]

发布时间:2025年12月16日
品牌从禁用转向强制使用生成式AI

品牌从禁用转向强制使用生成式AI

快速阅读: 据机构披露,生成式AI在营销领域的应用不断扩大,但面临商标稀释与版权侵权风险;企业多将其输出作为创作起点,并通过私有化部署或授权协议降低法律不确定性。 近日,生成式人工智能在营销领域的应用日益广泛,其法律边界问题引发关注。法律界 […]

发布时间:2025年12月16日
新泽西AI数据中心激增 监管滞后引关注

新泽西AI数据中心激增 监管滞后引关注

快速阅读: 12月16日消息,受AI算力需求激增推动,新泽西州已跻身全美前五大数据中心市场,但电力承压导致电价上涨,州长推迟能耗监管法案引发争议。同时,新提案要求数据中心使用新增清洁能源并公开能耗计划,以平衡产业发展与公众负担。 近年来,人 […]

发布时间:2025年12月16日
AI用电激增推高能源需求

AI用电激增推高能源需求

快速阅读: 据多家机构披露,MFS投资公司指出,AI发展推高电力需求,加剧电网压力,并重塑能源板块投资价值;其主动管理型ETF已重点布局能源企业,以捕捉AI驱动的结构性机遇。 今年以来,人工智能(AI)已成为2025年投资领域的核心主题之一 […]

发布时间:2025年12月16日
英伟达推开源模型赋能AI智能体

英伟达推开源模型赋能AI智能体

快速阅读: 据金融时报报道,英伟达发布开源大模型Nemotron 3,涵盖Nano、Super和Ultra三个版本,采用混合稀疏专家架构以提升推理吞吐量与多智能体协同能力,并首次全面开放权重与工具,推动其从硬件厂商向AI软件生态延伸。 近日 […]

发布时间:2025年12月16日
Jutro Medical完成3600万欧元A轮融资

Jutro Medical完成3600万欧元A轮融资

快速阅读: 据外媒报道,波兰AI医疗公司Jutro Medical完成2400万欧元融资,使其A轮融资总额达3600万欧元。该公司将利用这笔资金并购诊所、拓展欧洲市场,并深化AI代理开发,以应对基层医护短缺与行政负担问题。 波兰人工智能驱动 […]

发布时间:2025年12月16日
AI搜索与创作者冲击出版业

AI搜索与创作者冲击出版业

快速阅读: 据路透社报道,2025年AI搜索崛起冲击传统出版业,《独立报》《每日邮报》等加速融合创作者经济;Meta等社交平台弱化内容审核,广告收入却大幅增长;谷歌AI概览导致出版商流量锐减,欧盟已就其涉嫌垄断展开调查。 2025年,全球数 […]

发布时间:2025年12月16日
MIT团队AI系统获90%用户青睐

MIT团队AI系统获90%用户青睐

快速阅读: 截至发稿时,麻省理工学院联合谷歌DeepMind等机构开发出融合视觉与语言模型的AI系统,可理解文本与图像指令,辅助用户完成多组件物体的人机协同设计。该系统支持个性化调整并解释决策逻辑,在用户测试中获得超九成偏好,未来有望应用于 […]

发布时间:2025年12月16日