扩大 AI 扩散模型的用途和范围

发布时间：2025年4月3日来源：szf

快速阅读: 据《加州大学圣地亚哥分校新闻中心》称，研究团队提出一种新方法，通过在扩散模型中引入更大非高斯分布跳跃，减少中间步骤，加速模型运行，拓展其应用范围，如语言生成、长期推理与决策等。该技术有望提升多种下游任务的效率与效果。

经典的扩散模型逐步加入少量的高斯噪声（具有较小幅度的正态分布随机变量），以将数据分布转换为简单的基本正态分布。然而，据马介绍，研究团队不需要增量更新为小的高斯噪声，而是考虑在步骤间进行更大跳跃，这些跳跃可以是非正态分布。这些跳跃可能是长尾分布，甚至是通过子程序算法生成的分布。采用这种技术后，研究人员能够减少中间步骤的数量，并加速扩散模型的算法，使其更广泛地应用于各种任务。

“我们可以看到，这种泛化提升了扩散模型的效率。潜在地，它也可能极大地扩展扩散模型的应用范围，例如语言生成，以及更有趣的是长期推理与决策。”马说道。

除了马，研究团队还包括黄旭鹏（目前是HDSI的访问学生）、来自UIUC的张彤、来自香港大学的左迪凡和张一，以及来自Salesforce的董汉泽。

“这项工作的最令人兴奋之处在于它几乎可以利用所有中间过渡步骤，既能加快算法速度，又能使算法更广泛地应用于多种下游任务。”马表示，“我预计这项工作会被应用于文本生成、多模态生成、长期推理、工具使用与问题解决，以及决策任务，从而加速并提升这些任务的结果。”

如需了解更多详情，请访问加州大学圣地亚哥分校的研究与教育页面：人工智能。

(以上内容均由Ai生成)