小米开源3090亿参数MiMo-V2-Flash大模型
快速阅读: 据小米消息,小米发布开源大模型MiMo-V2-Flash,采用稀疏激活架构,总参数量达3090亿但推理仅激活150亿,在响应速度与成本效率上显著优于国产竞品,并以低价API和免费试用降低开发者门槛。
小米近日正式进军高性能开源大模型领域,发布全新基础语言模型MiMo-V2-Flash,并同步以MIT协议全面开源模型权重与推理代码。该模型主打“超高速、高效率”,在推理、代码生成及智能体任务中表现突出,实测响应速度优于豆包、DeepSeek和元宝等国产主流模型,引发开发者社区广泛关注。
MiMo-V2-Flash采用稀疏激活架构,总参数量达3090亿,但单次推理仅激活150亿参数,在保障强大性能的同时显著降低计算开销。凭借这一设计,该模型在多项公开基准测试中稳居开源模型第一梯队,兼顾性能与成本效率。
用户实测显示,在相同硬件条件下,MiMo-V2-Flash的生成延迟明显低于竞品,尤其在多轮对话与复杂逻辑推理场景中优势显著。有开发者评价其“不是快一点,是快一个量级”。为加速生态落地,小米同步推出极具竞争力的API定价:每百万输入Token仅0.1美元,输出Token为0.3美元,并提供限时免费试用,大幅降低中小企业与独立开发者的使用门槛。
值得注意的是,MiMo-V2-Flash不仅面向开发者,其通用能力也适配日常AI助手场景,可无缝集成至手机、智能家居、车载系统等小米“人车家全生态”终端。模型发布当日,小米将举办人车家全生态合作伙伴大会,预计进一步披露其在端云协同、设备端部署及多模态扩展等方面的深度应用规划。
在国产大模型竞争日益激烈的背景下,小米以“高性能+真开源+低门槛”策略切入,既彰显其长期布局AI的决心,也有望重塑开源大模型的性能与成本预期。
(以上内容均由Ai生成)
引用自:AIbase人工智能资讯平台