更快地解决复杂的规划问题
快速阅读: 据《科学日报》最新报道,麻省理工学院研究人员开发了一种基于机器学习的改进规划系统(L-RHO),显著提升了求解效率和方案质量,可广泛应用于复杂后勤问题。该方法通过预测哪些变量无需重新计算,减少冗余运算,优化资源配置。相关研究将在ICLR会议上发表。
工程师们使用名为“算法求解器”的软件来规划这些移动,但在一个每周有成千上万次到达和离开的车站,这个问题变得过于复杂,传统求解器无法一次性解决。
利用机器学习,麻省理工学院的研究人员开发了一种改进的规划系统,将求解时间减少了高达50%,并产生了一个更好地满足用户目标的解决方案,例如按时发车。这种方法还可以用于高效解决其他复杂的后勤问题,如安排医院工作人员、分配航空公司机组人员或为工厂机器分配任务。
工程师通常会把这类问题拆分成一系列相互重叠的小问题,每个小问题都可以在可行的时间内解决。但这些重叠导致许多决策被不必要的重新计算,因此求解器花费更长的时间才能达到最优解。
新的、增强的人工智能方法学习了每个小问题中哪些部分应该保持不变,避免重复计算,再由传统的算法求解器处理剩余变量。
“通常,一个专业团队可能需要花费数月甚至数年设计一种算法来解决其中一个组合优化问题。现代深度学习为我们提供了一个机会,可以借助人工智能加速其进程。我们可以借鉴已知的有效方法,并借助人工智能加速其进程,”麻省理工学院土木与环境工程系及数据、系统与社会研究所的凯西·吴教授说。
她与论文的主要作者李思锐、土木与环境工程研究生温斌欧阳以及LIDS博士后马一宁共同撰写了这篇论文。该研究将在国际学习表示会议(ICLR)上发表。
消除冗余
这项研究的一个动机是麻省理工学院入门级运输课程的一名硕士生德文·威尔金斯识别出的一个实际列车调度难题。这名学生希望将强化学习应用于波士顿北站的实际列车调度难题。交通组织需要将许多列车分配到有限数量的站台上,以便在它们到达车站之前能够及时完成掉头。
结果发现这是一个非常复杂的柔性作业车间调度问题——正是吴实验室过去几年一直在研究的问题类型。
当面对涉及分配有限资源给一组机器的长期问题时,如工厂任务,规划者通常会将问题视为柔性作业车间调度问题。
在柔性作业车间调度中,每个任务需要不同的完成时间,但任务可以分配给任何机器。同时,每个任务由必须按正确顺序执行的操作组成。
这些问题很快变得过于庞大而难以应对,因此用户可以采用滚动时域优化(RHO)将其分解成可更快解决的可管理块。
通过RHO,用户先将最初几个任务分配给机器,在一个固定的计划时域内,比如四小时的时间窗口。然后,他们执行序列中的第一个任务,并将四小时的计划时域向前推进以添加下一个任务,重复此过程直到整个问题得到解决并创建最终的任务-机器分配时间表。
计划时域应长于任何单个任务的持续时间,因为如果算法还考虑即将来临的任务,解决方案会更好。
“这些初步解决方案或许很好,无需再次计算,也可能不理想。这就是机器学习发挥作用的地方,”吴解释道。
为了他们的技术,他们称之为基于学习的滚动时域优化(L-RHO),研究人员教一个机器学习模型预测当计划时域向前滚动时,哪些操作或变量应该被重新计算。
L-RHO需要数据来训练模型,因此研究人员使用经典算法求解器解决了若干子问题。他们选取最佳解决方案——即需要重新计算的操作最少的方案——并将这些作为训练数据。
为了他们的技术,他们称之为基于学习的滚动时域优化(L-RHO),研究人员教一个机器学习模型预测当计划时域向前滚动时,哪些操作或变量应该被重新计算。
一旦训练完成,机器学习模型接收一个它从未见过的新子问题,并预测哪些操作不应该被重新计算。剩下的操作被反馈到算法求解器中,执行任务,重新计算这些操作,并将计划时域向前推进。然后循环重新开始。
“事后发现无需重新优化它们,那么我们可以从问题中剔除这些变量。由于这些问题的规模呈指数级增长,若能剔除其中一些变量,将大有裨益,”她补充道。
适应性强且可扩展的方法
为了测试他们的方法,研究人员将L-RHO与几种基本算法求解器、专用求解器以及仅使用机器学习的方法进行了比较。L-RHO在所有方面都表现得更好,求解时间减少了54%,解决方案质量提高了高达21%。
此外,当他们在更复杂的问题变体上测试该方法时,例如工厂机器出现故障或火车拥堵增加时,他们的方法继续优于所有基线方法。即使研究人员创建了额外的基线方法来挑战他们的求解器,L-RHO仍然表现得更好。
“我们的方法无需改动即可适用于所有这些不同变体,这是我们开展这一系列研究的目标,”她说。
L-RHO还可以根据目标的变化进行调整,自动生成一种新算法来解决此类问题——它只需要一个新的训练数据集。
在未来,研究人员希望深入理解模型为何选择冻结某些变量而非其他变量的逻辑。他们还想将其融入其他类型的复杂优化问题之中,如库存管理和车辆路径规划。
这项工作得到了国家科学基金会、麻省理工学院研究支持委员会、亚马逊机器人博士奖学金项目以及MathWorks的部分资助。
(以上内容均由Ai生成)