微软发布Agent Lightning,强化学习优化多代理系统

发布时间:2025年11月1日    来源:szf
微软发布Agent Lightning,强化学习优化多代理系统

快速阅读: 微软发布Agent Lightning开源框架,通过强化学习优化多代理系统,无需改动现有架构即可提升大规模语言模型性能,实验显示在多项任务中均有显著改进。

微软近日发布了Agent Lightning,这是一款开源框架,旨在通过强化学习(RL)优化多代理系统。Agent Lightning能够在不改变现有代理架构的前提下,将实际的代理行为转化为RL过渡,从而提高大规模语言模型(LLM)的性能。

该框架将代理视为一个决策过程,具体而言,它将代理的形式化为部分可观测的马尔可夫决策过程。代理的观察基于当前输入,行动则为模型调用,奖励可以是终极奖励或中间奖励。框架从代理模型中提取调用记录及输入、输出和奖励信息,以此来过滤多余噪声,生成用于训练的纯净过渡数据。

Agent Lightning采用了“训练代理解耦”的方法,由Lightning Server负责训练和服务,并提供了与OpenAI兼容的API接口,便于调用更新后的模型。Lightning Client则在现有代理运行时捕捉调用记录,实时传输至服务器。此设计保持了工具、浏览器等依赖项的紧密集成,同时将GPU训练集中在服务器层面。

Agent Lightning支持两种追踪路径。默认路径使用OpenTelemetry进行数据收集,便于将代理的遥测信息传送至标准收集器。另一种是轻量级的嵌入式追踪器,适用于不希望部署OpenTelemetry的团队。所有数据最终存储于同一位置,供训练使用。

在实验评估中,研究团队测试了三个任务:文本转SQL、检索增强生成和数学问答。文本转SQL任务基于Spider基准,涵盖超过10,000个问题和200个数据库。检索增强生成任务利用MuSiQue基准,基于包含2100万文档的维基百科规模索引。数学问答任务则使用Calc X数据集,涉及工具调用计算。每个任务的训练结果均显示了稳定的奖励提升。

论文链接:https://arxiv.org/abs/2508.03680v1

关键点:

– Agent Lightning是一个开源框架,可在不重构现有系统的情况下优化多代理系统。

– 该框架将代理建模为部分可观测的马尔可夫决策过程,提取干净的训练过渡数据。

– 实验表明,Agent Lightning在文本转SQL、检索增强生成和数学问答任务上均实现了显著的性能提升。

(以上内容均由Ai生成)

你可能还想读

Mistral AI发布OCR3模型准确率提升74%

Mistral AI发布OCR3模型准确率提升74%

快速阅读: 据Mistral AI消息,该公司近日发布Mistral OCR3文档识别技术,在表格、手写文本及复杂表单识别上准确率较前代提升74%,支持高精度提取文本与图像并输出为Markdown格式,每千页处理成本低至1美元,已应用于发票 […]

发布时间:2025年12月19日
阿里千问澄清全员大会吃豆包图系AI生成

阿里千问澄清全员大会吃豆包图系AI生成

快速阅读: 据阿里千问消息,针对网传“全员大会吃豆包”图片,公司澄清系AI伪造,Logo与工牌均有误,并呼吁同行理性竞争。阿里千问App自11月17日公测以来,23天月活用户突破3000万,现已成立C端事业群,由副总裁吴嘉负责。 今日,一张 […]

发布时间:2025年12月19日
全国产船舶交通管理系统在大连落地

全国产船舶交通管理系统在大连落地

快速阅读: 据机构披露,12月17日,大连船舶交通管理系统完成全国产化改造并正式交付,成为国内首个全信创VTS系统。该系统融合辽鲁20座雷达信号,具备智能告警与商渔避碰功能,显著提升通航效率和监管能力。 12月17日,大连船舶交通管理系统更 […]

发布时间:2025年12月19日
LeCun创立新公司专注世界模型研究

LeCun创立新公司专注世界模型研究

快速阅读: 记者从相关部门获悉,人工智能科学家杨立昆将创办AMI Labs,聚焦“世界模型”研究以突破大模型局限,并采用JEPA架构探索通用智能。公司计划于2026年1月成立,估值达30亿欧元,由其前Meta同事勒布伦出任CEO负责运营。 […]

发布时间:2025年12月19日
QQ音乐推本地AI作曲几分钟生成完整歌曲

QQ音乐推本地AI作曲几分钟生成完整歌曲

快速阅读: 记者从相关部门获悉,QQ音乐依托酷睿Ultra处理器推出本地化“AI作歌”功能,用户无需联网即可在设备端快速生成完整原创歌曲,既降低创作门槛,又保障歌词与旋律等敏感数据的隐私安全。 AI音乐创作正加速从云端走向个人设备。近日,Q […]

发布时间:2025年12月19日
火狐浏览器将推AI功能“终止开关”

火狐浏览器将推AI功能“终止开关”

快速阅读: 据AIbase报道,Mozilla新任CEO计划将Firefox转型为“现代AI浏览器”,引发用户对隐私和功能臃肿的担忧。为此,开发者宣布推出全局“终止开关”,彻底移除所有AI功能,并采取默认关闭、用户主动选择加入的模式,以重建 […]

发布时间:2025年12月19日
Manus 8个月ARR破1亿美元创全球纪录

Manus 8个月ARR破1亿美元创全球纪录

快速阅读: 据Manus消息,该公司年度经常性收入突破1亿美元,创全球初创企业最快纪录。自3月产品上线以来,其AI代理平台月复合增长率超20%,已处理147万亿tokens,并在多国市场实现用户真实付费,验证了通用AI代理的商业化潜力。 新 […]

发布时间:2025年12月19日
微信元宝AI助手上线一句话提醒功能

微信元宝AI助手上线一句话提醒功能

快速阅读: 12月19日消息,微信元宝AI助手上线智能提醒功能,用户可通过文字或语音发送任务指令,系统将自动识别时间与事项并准时推送通知,操作简便,支持老年用户。该助手无需下载,以好友形式集成于微信,并提供图文解析等实用工具。 近日,微信元 […]

发布时间:2025年12月19日