小米开源3090亿参数MiMo-V2-Flash大模型

发布时间：2025年12月17日来源：szf

快速阅读: 据小米消息，小米发布开源大模型MiMo-V2-Flash，采用稀疏激活架构，总参数量达3090亿但推理仅激活150亿，在响应速度与成本效率上显著优于国产竞品，并以低价API和免费试用降低开发者门槛。

小米近日正式进军高性能开源大模型领域，发布全新基础语言模型MiMo-V2-Flash，并同步以MIT协议全面开源模型权重与推理代码。该模型主打“超高速、高效率”，在推理、代码生成及智能体任务中表现突出，实测响应速度优于豆包、DeepSeek和元宝等国产主流模型，引发开发者社区广泛关注。

MiMo-V2-Flash采用稀疏激活架构，总参数量达3090亿，但单次推理仅激活150亿参数，在保障强大性能的同时显著降低计算开销。凭借这一设计，该模型在多项公开基准测试中稳居开源模型第一梯队，兼顾性能与成本效率。

用户实测显示，在相同硬件条件下，MiMo-V2-Flash的生成延迟明显低于竞品，尤其在多轮对话与复杂逻辑推理场景中优势显著。有开发者评价其“不是快一点，是快一个量级”。为加速生态落地，小米同步推出极具竞争力的API定价：每百万输入Token仅0.1美元，输出Token为0.3美元，并提供限时免费试用，大幅降低中小企业与独立开发者的使用门槛。

值得注意的是，MiMo-V2-Flash不仅面向开发者，其通用能力也适配日常AI助手场景，可无缝集成至手机、智能家居、车载系统等小米“人车家全生态”终端。模型发布当日，小米将举办人车家全生态合作伙伴大会，预计进一步披露其在端云协同、设备端部署及多模态扩展等方面的深度应用规划。

在国产大模型竞争日益激烈的背景下，小米以“高性能+真开源+低门槛”策略切入，既彰显其长期布局AI的决心，也有望重塑开源大模型的性能与成本预期。

(以上内容均由Ai生成)

引用自：AIbase人工智能资讯平台