美团发布560B参数模型LongCat-Flash-Chat,智能体表现亮眼
快速阅读: 美团发布AI大模型LongCat-Flash-Chat,拥有560亿参数,采用创新MoE架构,推理速度每秒100个token,智能体和通用知识测试表现优异,已开源。
美团近日发布了其最新的AI大模型——LongCat-Flash-Chat,并宣布开源。该模型拥有560亿总参数量和186亿至313亿的激活参数范围,展示了其在计算效率与性能方面的优越平衡。LongCat-Flash采用创新的混合专家模型(MoE)架构,通过“零计算专家”机制,每个token在处理时仅激活必要参数,确保算力高效利用。
在模型架构上,LongCat-Flash引入了跨层通道设计,大幅提升了训练和推理的并行性。这使得模型在30天的训练时间内,使用H800硬件达到每秒处理100个token的推理速度。训练过程中,通过PID控制器实时调整专家的偏置,保持激活参数的平均水平在27亿,有效控制算力消耗。
此外,LongCat-Flash在智能体能力的提升上也做了多项优化。通过构建自有Agentic评测集和多智能体数据生成策略,该模型在各类智能体任务中表现出色,尤其在复杂场景下,其在VitaBench基准测试中的得分位列第一。即使与参数规模更大的模型相比,LongCat-Flash依然展现出卓越的智能体工具使用能力。
在通用知识方面,LongCat-Flash同样表现不俗。在ArenaHard-V2测试中,其得分达到86.50,位列所有评估模型的第二;在MMLU和CEval基准测试中分别获得89.71和90.44的高分,显示了其在语言理解和中文能力评估上的竞争力。
凭借高效的推理速度和出色的智能体表现,LongCat-Flash-Chat不仅在技术上领先同行,其开源举措也为开发者提供了更多的研究和应用机会。
项目地址:https://github.com/meituan-longcat/LongCat-Flash-Chat
体验官网:https://longcat.ai/
(以上内容均由Ai生成)