苹果新模型FS-DFM，长文本写作效率提升128倍

发布时间：2025年10月14日来源：szf

快速阅读: 苹果与俄亥俄州立大学联合发布FS-DFM模型，仅需8轮迭代达到传统模型数千轮效果，写入速度提升128倍，显著提高长文本生成效率，性能测试优于大型模型。

苹果公司与俄亥俄州立大学的研究团队共同发布了FS-DFM（Few-Step Discrete Flow-Matching）模型。这一创新语言模型在长文本生成方面表现优异，仅需8轮快速迭代即可生成与传统模型数千轮迭代相匹敌的文本质量。此外，FS-DFM的写入速度最高可提升128倍，显著提升了长文本生成的效率。

FS-DFM的设计理念与主流语言模型有别。以ChatGPT为代表的自回归模型采用逐字生成的方式，每个字的生成都依赖于前文内容。而扩散模型则采取并行策略，一次性生成多个字，再通过多轮迭代逐步优化最终结果。FS-DFM在此基础上进一步简化，旨在用更少的步骤实现高质量文本的生成。

为了实现这一突破，苹果研究团队提出了一个巧妙的三步方法。首先，模型经过特殊训练，能够灵活应对不同数量的精炼迭代。其次，团队引入了一个“教师”模型来指导，确保每轮迭代中的更新既显著又精确，避免过度调整。最后，团队优化了迭代机制，使模型能够在更少且更为稳健的步骤中生成最终文本。

在性能评估中，FS-DFM与参数量分别为70亿的Dream模型和80亿的LLaDA模型进行了比较。测试结果显示，尽管FS-DFM的参数量仅为1.7亿至17亿，但在文本生成的困惑度（越低越好，反映文本的准确性和流畅性）和熵（衡量模型选择词汇的信心）两个关键指标上，FS-DFM均展现出更低的困惑度和更稳定的熵值。这表明FS-DFM模型在AI长文本写作领域具有巨大潜力。

项目链接：https://machinelearning.apple.com/research/fs-dfm **要点总结：** 📝 FS-DFM模型仅需8轮迭代，生成质量与传统模型数千轮相当。 🚀 写入速度提升最高达128倍，显著提高长文本生成效率。 🔍 性能测试显示，FS-DFM在困惑度和熵的关键指标上均优于其他大型模型。

(以上内容均由Ai生成)