美团发布560B参数模型LongCat-Flash-Chat，智能体表现亮眼

发布时间：2025年9月1日来源：szf

快速阅读: 美团发布AI大模型LongCat-Flash-Chat，拥有560亿参数，采用创新MoE架构，推理速度每秒100个token，智能体和通用知识测试表现优异，已开源。

美团近日发布了其最新的AI大模型——LongCat-Flash-Chat，并宣布开源。该模型拥有560亿总参数量和186亿至313亿的激活参数范围，展示了其在计算效率与性能方面的优越平衡。LongCat-Flash采用创新的混合专家模型（MoE）架构，通过“零计算专家”机制，每个token在处理时仅激活必要参数，确保算力高效利用。

在模型架构上，LongCat-Flash引入了跨层通道设计，大幅提升了训练和推理的并行性。这使得模型在30天的训练时间内，使用H800硬件达到每秒处理100个token的推理速度。训练过程中，通过PID控制器实时调整专家的偏置，保持激活参数的平均水平在27亿，有效控制算力消耗。

此外，LongCat-Flash在智能体能力的提升上也做了多项优化。通过构建自有Agentic评测集和多智能体数据生成策略，该模型在各类智能体任务中表现出色，尤其在复杂场景下，其在VitaBench基准测试中的得分位列第一。即使与参数规模更大的模型相比，LongCat-Flash依然展现出卓越的智能体工具使用能力。

在通用知识方面，LongCat-Flash同样表现不俗。在ArenaHard-V2测试中，其得分达到86.50，位列所有评估模型的第二；在MMLU和CEval基准测试中分别获得89.71和90.44的高分，显示了其在语言理解和中文能力评估上的竞争力。

凭借高效的推理速度和出色的智能体表现，LongCat-Flash-Chat不仅在技术上领先同行，其开源举措也为开发者提供了更多的研究和应用机会。

项目地址：https://github.com/meituan-longcat/LongCat-Flash-Chat

体验官网：https://longcat.ai/

(以上内容均由Ai生成)