研究人员教授 LLM 解决复杂的规划挑战

快速阅读: 《麻省理工学院》消息，麻省理工学院的研究人员开发了一种框架LLMFP，利用大型语言模型（LLMs）将复杂规划问题转化为数学公式，再由优化求解器自动求解。该框架在多项测试中表现出色，能自动识别并修正错误，适应不同优化求解器，为非专家用户提供便捷的智能规划助手。

想象一家咖啡公司试图优化其供应链。该公司从三家供应商处采购咖啡豆，在两个设施中将其烘焙成深色或浅色咖啡，然后将烘焙好的咖啡运往三个零售点。供应商具有不同的固定产能，烘焙成本和运输成本因地点而异。公司希望在需求增长23%的情况下尽量降低成本。

事实上，尽管大型语言模型（LLMs）具有各种令人难以置信的能力，但它们在直接解决如此复杂的规划问题时往往表现不佳。麻省理工学院的研究人员并没有尝试改变模型以使LLM成为更好的规划者，而是采取了另一种方法。他们设计了一个框架，引导LLM像人一样分解问题，然后使用强大的软件工具自动解决问题。用户只需用自然语言描述问题即可，无需针对具体任务提供示例来训练或提示LLM。

该模型将用户的文本提示编码为一种优化求解器可以解开的格式，这种求解器旨在高效破解极其棘手的规划挑战。在公式化过程中，LLM会在多个中间步骤检查自己的工作，确保问题正确地描述给求解器。如果发现错误，LLM不会放弃，而是尝试修复公式中的错误部分。

当研究人员在九个复杂的挑战上测试他们的框架时，例如最小化仓库机器人完成任务所需的移动距离，它达到了85%的成功率，而最好的基线模型仅达到了39%的成功率。这个多功能框架可以应用于一系列多步骤规划任务，例如安排航空公司机组人员或管理工厂中的机器时间。

“我们的研究介绍了一个框架，本质上是一个智能助理，用于规划问题。即使规则复杂或不寻常，它也能找出满足所有需求的最佳计划，”麻省理工学院信息与决策系统实验室（LIDS）的研究生、这项研究论文的主要作者郝一伦说道。她与麻省理工学院-IBM沃森人工智能实验室的研究科学家张阳以及资深作者范楚楚共同撰写了这篇论文，后者是航空与航天工程副教授兼LIDS首席研究员。这项研究将在国际学习表征会议（ICLR）上发表。

优化入门

范小组开发了算法，能够自动解决所谓的组合优化问题。这些问题包含许多相互关联的决策变量，每个变量都有多种选择，迅速累积到数十亿种潜在选择。人类通过缩小选项范围并确定哪个选项能带来最佳整体计划来解决此类问题。

研究人员的算法求解器将相同的原则应用于那些过于复杂以至于人类无法破解的优化问题。但是他们开发的求解器通常有陡峭的学习曲线，通常只由专家使用。“我们认为LLMs可以让非专家使用这些求解算法。在我们的实验室里，我们把领域专家的问题形式化为我们的求解器可以解决的问题。我们能否教LLM做同样的事情？”范说。

使用研究人员开发的框架LLM-Based Formalized Programming（LLMFP），一个人提供问题的自然语言描述、任务的背景信息和描述目标的查询。然后LLMFP提示LLM推理问题并确定将塑造最优解决方案的决策变量和关键约束条件。

使用研究人员开发的框架LLM-Based Formalized Programming（LLMFP），一个人提供问题的自然语言描述、任务的背景信息和描述目标的查询。LLMFP要求LLM详细说明每个变量的要求，然后再将信息编码为优化问题的数学公式。它生成编码问题的代码，并调用相关的优化求解器，从而得出理想解决方案。

使用研究人员开发的框架LLM-Based Formalized Programming（LLMFP），一个人提供问题的自然语言描述、任务的背景信息和描述目标的查询。“这类似于我们在麻省理工学院如何向本科生教授优化问题。我们不是只教一个领域。我们教授的是方法论，”范补充道。

只要求解器的输入正确，它就会给出正确的答案。任何解法中的错误都源于公式化过程中的失误。为了确保找到一个可行的计划，LLMFP分析解决方案并修改问题公式中的任何错误步骤。一旦计划通过了自我评估，解决方案将以自然语言的形式描述给用户。

完善计划

郝表示，这个自我评估模块还允许LLM添加任何第一次遗漏的隐式约束条件。例如，如果框架正在优化供应链以最小化咖啡店的成本，人类知道咖啡店不能运送负数量的烘焙豆，但LLM可能没有意识到这一点。自我评估步骤会标记此错误并提示模型进行修复。

“此外，LLM可以根据用户的偏好进行调整。如果模型意识到某个特定用户不喜欢更改旅行计划的时间或预算，它可以建议调整符合用户需求的内容，”范说。

在一系列测试中，他们的框架使用几种LLM在九个不同的规划问题上取得了平均成功率在83%到87%之间。虽然某些基线模型在某些问题上表现更好，但LLMFP的整体成功率大约是基线技术的两倍。

与其他方法不同，LLMFP不需要领域特定的示例进行训练。它可以立即找到规划问题的最优解决方案。此外，用户可通过调整传递给LLM的提示，使LLMFP适用于不同的优化求解器。

“有了LLMs，我们有机会创建一个界面，让人们使用其他领域的工具以他们之前可能未曾考虑过的方式解决问题，”范说。

在未来，研究人员希望能让LLMFP接受图像作为输入，以补充规划问题的描述。这将帮助框架解决那些很难用自然语言完整描述的任务。

这项研究部分由美国海军研究办公室和MIT-IBM沃森人工智能实验室资助。

(以上内容均由Ai生成)