AI

程序记忆降低AI代理成本与复杂度

发布时间:2025年8月27日    来源:szf
程序记忆降低AI代理成本与复杂度

快速阅读: 浙江大学和阿里巴巴开发Memp技术,为大型语言模型提供动态程序记忆,提高处理复杂任务的效率和成功率,减少重复探索,实现跨任务知识迁移。

浙江大学和阿里巴巴集团开发了一种新技术,赋予大型语言模型(LLM)代理动态记忆,使它们在处理复杂任务时更加高效和有效。这项名为Memp的技术为代理提供了“程序记忆”,这种记忆会随着经验的积累而不断更新,类似于人类通过实践学习的方式。

Memp创建了一个终身学习框架,使代理在面对新任务时不必每次都从头开始。相反,它们会在遇到新情况时逐渐变得更好、更高效,这是实现可靠企业自动化的关键需求。

研究人员指出,尽管许多复杂任务表面不同,但它们在深层次上具有共同的结构特征。因此,代理应能够从过去的成功和失败中提取并重用经验,而不是每次都需要重新学习这些模式。这需要一种特定的“程序记忆”,即人类负责打字或骑自行车等技能的长期记忆,这些技能会随着练习而变得自动。

当前的代理系统通常缺乏这种能力。它们的程序知识通常由开发人员手工编写,存储在僵硬的提示模板中或嵌入模型参数中,这些参数昂贵且难以更新。即使现有的增强记忆框架也只提供粗略的抽象,并不能充分解决如何构建、索引、纠正和最终修剪代理生命周期中的技能的问题。

因此,研究者在论文中提到,“没有原则性方法来量化代理如何高效地发展其程序库,也无法保证新体验能改善而非削弱性能。”

Memp是一个与任务无关的框架,将程序记忆视为一个核心组件进行优化。它包括三个关键阶段,形成一个持续循环:构建、检索和更新记忆。记忆从代理过去的经历或“轨迹”中构建。研究人员探索了以逐字步骤或提炼成更高层次脚本的形式存储这些记忆。在检索过程中,代理在接收到新任务时搜索最相关的过去经验。团队尝试了不同的方法,如向量搜索,以匹配新任务描述与过去查询,或提取关键词找到最佳匹配。

最关键的部分是更新机制。Memp引入了多种策略,确保代理的记忆随时间演变。随着代理完成更多任务,其记忆可以通过简单添加新经验、筛选成功结果或最有效地反思失败来纠正和修订原始记忆。

Memp专注于动态、演化的记忆,处于一个旨在使AI代理更适合长期任务的研究领域。这项工作与其他努力相呼应,如Mem0,它将长时间对话中的关键信息整合为结构化事实和知识图谱,以确保一致性。类似地,A-MEM使代理能够自主创建并链接“记忆笔记”,形成复杂的知识结构。

然而,共同作者方润南强调了Memp与其他框架之间的关键区别。“Mem0和A-MEM是出色的工作……但它们侧重于记住单个轨迹或对话中的显著内容,”方润南在接受VentureBeat采访时说。它们帮助代理记住“发生了什么”。相比之下,“Memp针对跨轨迹的程序记忆。”它关注可以跨类似任务推广的“如何做”知识,防止代理每次重新探索。

方表示:“通过将过去的成功工作流程提炼为可重用的过程先验,Memp 提高了成功率并缩短了步骤。” 他补充说:“关键是我们还引入了一种更新机制,使这种过程记忆能够不断改进——毕竟,熟能生巧。”

解决“冷启动”问题

虽然从过去轨迹中学习的概念非常强大,但它提出了一个实际问题:当没有完美的例子可供学习时,代理如何建立其初始记忆?研究人员以务实的方法解决了这个“冷启动”问题。方解释说,开发人员可以首先定义一个强大的评估指标,而不需要预先提供完美的“黄金”轨迹。这个指标可以是基于规则的,甚至可以是另一个大模型,用于评分代理的表现。“一旦确定了这个指标,我们就让最先进的模型在代理工作流中探索,并保留得分最高的轨迹。” 方说。这个过程迅速引导出一组有用的初始记忆,使新的代理无需大量手动编程就能快速上手。

Memp 的应用

为了测试框架,研究团队在强大的大模型如 GPT-4、Claude 3.5 和 Qwen 2.5 上实现了 Memp,并在 ALFWorld 基准测试中的家庭杂务和 TravelPlanner 中的信息搜索等复杂任务上对其进行了评估。结果显示,构建和检索过程记忆使代理能够有效地提炼和重用其先前的经验。测试中,配备 Memp 的代理不仅提高了成功率,还变得更加高效。它们消除了无果的探索和试错,显著减少了完成任务所需的步骤数和消耗的令牌数。

使用过程记忆(右图)帮助代理用更少的步骤和更少的令牌完成任务(来源:arXiv)

对企业应用的一个重要发现是,过程记忆是可以转移的。在一个实验中,由强大的 GPT-4 生成的过程记忆被赋予了一个较小的模型 Qwen 2.5-14B。较小的模型性能显著提升,提高了成功率并减少了完成任务所需的步骤数。方表示,这之所以有效,是因为较小的模型通常能很好地处理简单的单步操作,但在长期规划和推理方面表现不佳。来自较大模型的过程记忆有效地填补了这一能力缺口。这表明,可以使用最先进的模型获取知识,然后部署在较小且更具成本效益的模型上,而不会失去这些经验带来的好处。

迈向真正自主的代理

通过为代理配备记忆更新机制,Memp 框架使代理能够在实时环境中持续构建和改进其过程知识。研究人员发现,这使代理具备了“持续、几乎线性的任务掌握能力”。然而,实现完全自主还需要克服另一个障碍:许多现实世界中的任务,如撰写研究报告,缺乏简单的成功信号。为了不断改进,代理需要知道它是否做得好。方认为未来的方向是使用大模型本身作为评判者。

“如今我们经常结合强大的模型和手工编写的规则来计算完成分数,”他指出,“这确实可行,但手工编写规则脆弱且难以推广。” 使用大模型作为评判者可以为代理提供复杂的监督反馈,使其在复杂和主观的任务中自我纠正。这将使整个学习循环更加可扩展和稳健,标志着向构建具有韧性和适应性的真正自主 AI 工作者迈出的关键一步。

(以上内容均由Ai生成)

你可能还想读

TCS推AI机器狗进军航空业

TCS推AI机器狗进军航空业

快速阅读: 据印度塔塔咨询服务公司(TCS)发布消息称,全球航空航天业加速绿色智能化转型,40%企业预计五年内实现“熄灯工厂”,数字孪生与eVTOL成重点方向,物理AI机器人有望获批用于高危场景。 日前,全球航空航天产业加速向绿色化、智能化 […]

发布时间:2025年12月8日
Meta签约多家媒体,为AI提供实时新闻

Meta签约多家媒体,为AI提供实时新闻

快速阅读: 据媒体报道,Meta与CNN、福克斯新闻等多家国际媒体签署AI数据合作协议,重启付费合作以提升Meta AI在新闻时效性与准确性方面的表现,并引导用户访问合作方网站。 日前,美国科技企业Meta宣布与多家国际新闻机构签署商业人工 […]

发布时间:2025年12月8日
Semaverse推AI平台赋能并购决策

Semaverse推AI平台赋能并购决策

快速阅读: 据最新消息,人工智能初创企业Semaverse近日推出“并购智能基础设施”平台,依托多智能体架构与智能记忆系统,为私募股权基金等提供覆盖交易全周期的五大智能化功能,助力数据驱动决策。 近日,人工智能初创企业Semaverse正式 […]

发布时间:2025年12月8日
Gartner建议全面禁用AI浏览器

Gartner建议全面禁用AI浏览器

快速阅读: 据Gartner发布消息称,AI浏览器存在严重数据安全与隐私风险,其侧边栏功能可能自动上传敏感信息至云端,企业部署前须严格评估后端安全机制并限制高危操作场景。 日前,国际知名研究机构Gartner发布风险警示,指出当前流行的AI […]

发布时间:2025年12月8日
利雅得航空携手IBM打造全球首家AI原生航司

利雅得航空携手IBM打造全球首家AI原生航司

快速阅读: 据最新消息,IBM依托混合云与红帽OpenShift技术,为175国客户提供AI及量子计算等创新方案,加速金融、医疗等关键领域数字化转型,深化本地化服务以提升全球产业链智能化水平。 国际商业机器公司(IBM)日前宣布,其作为全球 […]

发布时间:2025年12月8日
英语国家民众对AI更悲观

英语国家民众对AI更悲观

快速阅读: 据YouGov发布消息称,其2025年8月对九国调查显示,西欧民众对AI态度较积极,英语国家更悲观,就业影响最受担忧,而医疗、办公等领域获普遍认可。 日前,国际民调机构YouGov发布一项涵盖九国的调查报告显示,公众对人工智能( […]

发布时间:2025年12月8日
AI无法替代税务专家的判断与质疑

AI无法替代税务专家的判断与质疑

快速阅读: 12月8日消息,专家警示AI在税务申报中存在合规与伦理风险,强调其无法替代专业判断,呼吁合理界定应用边界,防范不法机构借智能算法诱导激进申报,确保人机协同、合法合规。 近日,有关人工智能在税务申报领域应用的讨论引发关注。专家指出 […]

发布时间:2025年12月8日
德州法学院以伦理先行培养AI时代律师

德州法学院以伦理先行培养AI时代律师

快速阅读: 据彭博法律报道,美国得州多所法学院以伦理为先推动AI审慎融入法律教育,要求明确使用规范并强调人类判断不可替代,呼应州律师协会第705号伦理准则。 近日,美国得克萨斯州在人工智能时代积极探索法律教育的务实路径,强调以伦理为先、审慎 […]

发布时间:2025年12月8日