扩大 AI 扩散模型的用途和范围
快速阅读: 据《加州大学圣地亚哥分校新闻中心》称,研究团队提出一种新方法,通过在扩散模型中引入更大非高斯分布跳跃,减少中间步骤,加速模型运行,拓展其应用范围,如语言生成、长期推理与决策等。该技术有望提升多种下游任务的效率与效果。
经典的扩散模型逐步加入少量的高斯噪声(具有较小幅度的正态分布随机变量),以将数据分布转换为简单的基本正态分布。然而,据马介绍,研究团队不需要增量更新为小的高斯噪声,而是考虑在步骤间进行更大跳跃,这些跳跃可以是非正态分布。这些跳跃可能是长尾分布,甚至是通过子程序算法生成的分布。采用这种技术后,研究人员能够减少中间步骤的数量,并加速扩散模型的算法,使其更广泛地应用于各种任务。
“我们可以看到,这种泛化提升了扩散模型的效率。潜在地,它也可能极大地扩展扩散模型的应用范围,例如语言生成,以及更有趣的是长期推理与决策。”马说道。
除了马,研究团队还包括黄旭鹏(目前是HDSI的访问学生)、来自UIUC的张彤、来自香港大学的左迪凡和张一,以及来自Salesforce的董汉泽。
“这项工作的最令人兴奋之处在于它几乎可以利用所有中间过渡步骤,既能加快算法速度,又能使算法更广泛地应用于多种下游任务。”马表示,“我预计这项工作会被应用于文本生成、多模态生成、长期推理、工具使用与问题解决,以及决策任务,从而加速并提升这些任务的结果。”
如需了解更多详情,请访问加州大学圣地亚哥分校的研究与教育页面:人工智能。
(以上内容均由Ai生成)