研究人员教授 LLM 解决复杂的规划挑战

发布时间:2025年4月2日    来源:szf
研究人员教授 LLM 解决复杂的规划挑战

快速阅读: 《麻省理工学院》消息,麻省理工学院的研究人员开发了一种框架LLMFP,利用大型语言模型(LLMs)将复杂规划问题转化为数学公式,再由优化求解器自动求解。该框架在多项测试中表现出色,能自动识别并修正错误,适应不同优化求解器,为非专家用户提供便捷的智能规划助手。

想象一家咖啡公司试图优化其供应链。该公司从三家供应商处采购咖啡豆,在两个设施中将其烘焙成深色或浅色咖啡,然后将烘焙好的咖啡运往三个零售点。供应商具有不同的固定产能,烘焙成本和运输成本因地点而异。公司希望在需求增长23%的情况下尽量降低成本。

事实上,尽管大型语言模型(LLMs)具有各种令人难以置信的能力,但它们在直接解决如此复杂的规划问题时往往表现不佳。麻省理工学院的研究人员并没有尝试改变模型以使LLM成为更好的规划者,而是采取了另一种方法。他们设计了一个框架,引导LLM像人一样分解问题,然后使用强大的软件工具自动解决问题。用户只需用自然语言描述问题即可,无需针对具体任务提供示例来训练或提示LLM。

该模型将用户的文本提示编码为一种优化求解器可以解开的格式,这种求解器旨在高效破解极其棘手的规划挑战。在公式化过程中,LLM会在多个中间步骤检查自己的工作,确保问题正确地描述给求解器。如果发现错误,LLM不会放弃,而是尝试修复公式中的错误部分。

当研究人员在九个复杂的挑战上测试他们的框架时,例如最小化仓库机器人完成任务所需的移动距离,它达到了85%的成功率,而最好的基线模型仅达到了39%的成功率。这个多功能框架可以应用于一系列多步骤规划任务,例如安排航空公司机组人员或管理工厂中的机器时间。

“我们的研究介绍了一个框架,本质上是一个智能助理,用于规划问题。即使规则复杂或不寻常,它也能找出满足所有需求的最佳计划,”麻省理工学院信息与决策系统实验室(LIDS)的研究生、这项研究论文的主要作者郝一伦说道。她与麻省理工学院-IBM沃森人工智能实验室的研究科学家张阳以及资深作者范楚楚共同撰写了这篇论文,后者是航空与航天工程副教授兼LIDS首席研究员。这项研究将在国际学习表征会议(ICLR)上发表。

优化入门

范小组开发了算法,能够自动解决所谓的组合优化问题。这些问题包含许多相互关联的决策变量,每个变量都有多种选择,迅速累积到数十亿种潜在选择。人类通过缩小选项范围并确定哪个选项能带来最佳整体计划来解决此类问题。

研究人员的算法求解器将相同的原则应用于那些过于复杂以至于人类无法破解的优化问题。但是他们开发的求解器通常有陡峭的学习曲线,通常只由专家使用。“我们认为LLMs可以让非专家使用这些求解算法。在我们的实验室里,我们把领域专家的问题形式化为我们的求解器可以解决的问题。我们能否教LLM做同样的事情?”范说。

使用研究人员开发的框架LLM-Based Formalized Programming(LLMFP),一个人提供问题的自然语言描述、任务的背景信息和描述目标的查询。然后LLMFP提示LLM推理问题并确定将塑造最优解决方案的决策变量和关键约束条件。

使用研究人员开发的框架LLM-Based Formalized Programming(LLMFP),一个人提供问题的自然语言描述、任务的背景信息和描述目标的查询。LLMFP要求LLM详细说明每个变量的要求,然后再将信息编码为优化问题的数学公式。它生成编码问题的代码,并调用相关的优化求解器,从而得出理想解决方案。

使用研究人员开发的框架LLM-Based Formalized Programming(LLMFP),一个人提供问题的自然语言描述、任务的背景信息和描述目标的查询。“这类似于我们在麻省理工学院如何向本科生教授优化问题。我们不是只教一个领域。我们教授的是方法论,”范补充道。

只要求解器的输入正确,它就会给出正确的答案。任何解法中的错误都源于公式化过程中的失误。为了确保找到一个可行的计划,LLMFP分析解决方案并修改问题公式中的任何错误步骤。一旦计划通过了自我评估,解决方案将以自然语言的形式描述给用户。

完善计划

郝表示,这个自我评估模块还允许LLM添加任何第一次遗漏的隐式约束条件。例如,如果框架正在优化供应链以最小化咖啡店的成本,人类知道咖啡店不能运送负数量的烘焙豆,但LLM可能没有意识到这一点。自我评估步骤会标记此错误并提示模型进行修复。

“此外,LLM可以根据用户的偏好进行调整。如果模型意识到某个特定用户不喜欢更改旅行计划的时间或预算,它可以建议调整符合用户需求的内容,”范说。

在一系列测试中,他们的框架使用几种LLM在九个不同的规划问题上取得了平均成功率在83%到87%之间。虽然某些基线模型在某些问题上表现更好,但LLMFP的整体成功率大约是基线技术的两倍。

与其他方法不同,LLMFP不需要领域特定的示例进行训练。它可以立即找到规划问题的最优解决方案。此外,用户可通过调整传递给LLM的提示,使LLMFP适用于不同的优化求解器。

“有了LLMs,我们有机会创建一个界面,让人们使用其他领域的工具以他们之前可能未曾考虑过的方式解决问题,”范说。

在未来,研究人员希望能让LLMFP接受图像作为输入,以补充规划问题的描述。这将帮助框架解决那些很难用自然语言完整描述的任务。

这项研究部分由美国海军研究办公室和MIT-IBM沃森人工智能实验室资助。

(以上内容均由Ai生成)

你可能还想读

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

本周科技大事件:谷歌发布Pixel 10,Gamescom揭晓重磅游戏

快速阅读: 谷歌推出Pixel 10手机及Pixel Watch 4,新增卫星紧急通讯、可更换电池和屏幕、抬手通话等功能,屏幕亮度达3000尼特,还将与斯蒂芬·库里合作推出AI健康和健身教练服务。 谷歌本周在“由谷歌制造”活动中推出了Pix […]

发布时间:2025年8月23日
SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

SK海力士凭借HBM激增首次超越三星,领跑全球内存市场

快速阅读: 据《《韩国先驱报》》称,7月20日,SK海力士首登全球内存芯片市场榜首,受益于AI产品和HBM芯片领先地位。其季度利润达9.2万亿韩元,远超三星。 据韩联社报道,7月20日,韩国京畿道伊川,SK海力士首次登上全球内存芯片市场榜首 […]

发布时间:2025年8月1日
STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

STAN 从谷歌、万代南梦宫和其他公司筹集了 850 万美元

快速阅读: 据《印度教业务线》称,STAN获850万美元融资,由万代南梦宫等机构投资。计划拓展印度市场,加强AI功能与创作者工具。平台用户超2500万,专注移动端社交游戏。 记者获悉,8月1日,社交游戏平台STAN宣布完成850万美元的新一 […]

发布时间:2025年8月1日
“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

“这改变了一切”:谷歌的人工智能模式迫使品牌重新考虑搜索策略

快速阅读: 据《营销周》称,谷歌推出AI搜索模式,减少外部链接,提升对话式回答。品牌需调整策略,重视内容质量与品牌权威。此变化影响营销方式,竞争加剧。 据谷歌官方消息,7月29日,谷歌在英国推出了基于人工智能的搜索功能AI模式,此前该功能已 […]

发布时间:2025年8月1日
在 Android 上用更智能的应用程序替换 Google Assistant

在 Android 上用更智能的应用程序替换 Google Assistant

快速阅读: 据《电话竞技场》称,据报道,用户可从Google Play下载Meta AI应用,安装后需检查版本是否为230.0.0.36.164或更高。操作方法:进入设置,选择应用,查看Meta AI信息页底部的版本号。 据媒体报道,用户现 […]

发布时间:2025年8月1日
Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

Xero 的英国董事总经理回击人工智能正在抢走会计工作的说法

快速阅读: 据《UKTN(英国科技新闻)》称,英国科技媒体UKTN报道,Xero英国总经理凯特·海沃德表示,会计行业无需过度担忧AI自动化。尽管四大事务所裁员,但Xero仍持续投资AI技术,提升效率与服务质量。 据英国科技新闻网站UKTN报 […]

发布时间:2025年8月1日
Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

Reddit 计划在搜索引擎市场大力推动人工智能与谷歌竞争:报告

快速阅读: 据《商业标准》称,Reddit CEO表示,公司正将平台转型为搜索引擎,整合AI功能,提升用户体验。Reddit Answers用户已超600万,计划全球推广。 据《The Verge》报道,7月11日,Reddit首席执行官史 […]

发布时间:2025年8月1日
Meta 超出预期,为“个人超级智能”做准备

Meta 超出预期,为“个人超级智能”做准备

快速阅读: 据《RCR无线》称,Meta二季度营收475.2亿美元,净利润183亿美元。CEO扎克伯格称将打造个人超级智能,但数据中心扩容遇挑战。公司计划2025年支出达1140-1180亿美元。 据媒体报道,7月25日,美国加州,社交媒体 […]

发布时间:2025年8月1日