长度 – 数智风暴

新技术帮助 LLM 控制 CoT 长度，在不增加计算成本的情况下优化推理

快速阅读: 据《VentureBeat 公司》称，卡内基梅隆大学的研究人员开发了一种名为长度控制策略优化（LCPO）的技术，通过训练让大型语言模型在保持推理准确性的同时控制链式思维（CoT）的长度。实验表明，基于LCPO训练的模型在准确性与 […]

发布时间：2025-03-14 04:42 来源：szf