使用多步非线性自回归和图形嵌入进行快速高保真量子模拟
快速阅读: 据《Nature.com》称,本文介绍了一种基于双重图嵌入的新多保真方法,用于高效提取特征并将其应用于非线性多步自回归模型。该方法在多个基准问题上的实验表明,其通用性和高精度只需几十到几千个高保真训练点,比传统方法减少了数个数量级。此外,我们还构建了一个包含860个苯醌分子的基准数据集,涵盖多种能量和电子性质。
通过机器学习辅助的量子力学模拟来设计和进行材料的高通量筛选通常需要存在非常庞大的数据集,这些数据集往往来自于高精度或高保真度的模拟。对于复杂分子,单个高保真度的模拟可能需要几天时间。因此,尽管机器学习替代仿真看起来很有前景,但生成训练数据可能会背离初衷。正因为如此,利用机器学习对材料进行筛选或设计,在许多重要应用中仍难以实现。
因此,尽管机器学习替代仿真看起来很有前景,但生成训练数据可能会背离初衷。本文提出了一种基于双重图嵌入的新多保真方法,用于提取特征,并将这些特征放入非线性多步自回归模型中。在五个基准问题上进行的实验,涉及14种不同参数和27种不同理论水平,展示了该方法的通用性和高精度。它通常只需要几十到几千个高保真训练点,这比直接机器学习方法低几个数量级,比其他多保真方法低可达两到三个数量级。
此外,我们开发了一个新的基准数据集,包含860个苯醌分子,最多有14个原子,涵盖了能量、HOMO能级、LUMO能级和偶极矩值,最高达到单双激发耦合簇。
(以上内容均由Ai生成)