MiniMax发布开源大模型M2,性能超群成本低
快速阅读: 10月27日,上海AI企业MiniMax发布开源大模型MiniMax-M2,性能超越谷歌Claude Sonnet 4.5,成本仅为8%,跻身全球前五,成为首个进入国际权威榜单的中国开源模型。
上海AI独角兽发布全新开源模型,引起全球关注。10月27日,澎湃新闻记者获悉,MiniMax(稀宇极智)发布并开源了新一代文本大模型MiniMax-M2,在全球权威测评榜单Artificial Analysis (AA)中,总分位列全球前五、开源第一,跻身全球第一梯队,与OpenAI、谷歌等硅谷巨头同台竞技。这是中国开源大模型首次在该榜单中跻身全球前五。
在性能方面,这款大模型的速度超过谷歌旗下的Claude Sonnet 4.5近一倍,而价格仅为后者的8%。“让每个人都用得起AI,这是我们对AI发展的判断。我们认为AGI一定会实现,并且一定会服务大众、普惠大众。”在不久前的世界人工智能大会(WAIC)上,MiniMax创始人闫俊杰表示,他认为中国AI企业正以“高智能、低成本”的新组合,向全球AI格局发起正面冲击。
此次发布的M2大模型进一步降低了大模型的使用成本:其综合成本API(接口)价格定为每百万Token输入0.3美元/2.1元人民币,输出1.2美元/8.4元人民币,同时在线上提供TPS(每秒输出Token数)约100的推理服务(仍在快速提升)。这意味着,其综合成本不到OpenAI旗下旗舰大模型GPT-5 (high) 的六分之一,且不到Claude 4.5 Sonnet的十分之一(约为8%)。
在性能上,MiniMax在代码(Coding)、代理(Agentic)、深度搜索(Deep Search)等方面进行了优化,通过高效的激活参数设计,实现了智能、速度与成本的最佳平衡。在全球核心权威榜单上,得分超过了谷歌的Gemini 2.5 Pro、Anthropic的Claude 4.1等最新SOTA模型。过去,国产模型多在文本生成上竞争,现在MiniMax能在“复杂信息检索与推理”中与GPT-5、Claude这类SOTA模型并列,表明强化学习(RL)与推理优化的策略正在奏效。
这标志着中国开源模型首次在国际通用智能评测体系中达到“第一梯队”水准,真正进入了“可与全球顶尖模型竞争”的阶段。中国大模型的发展也赢得了海外的好评。硅谷科技巨头Meta曾在论文中提到,MiniMax的研究是近期强化学习(RL)突破的代表之一,他们采用了MiniMax提出的CISPO损失函数和FP32 Head技术,这些技术也在强化学习(RL)阶段提出了关键创新点,旨在使模型在大规模训练中更稳定、更准确、更具泛化能力。
知名科技评测平台LMarena第一时间在社交媒体上向开发者推荐M2模型测试;Reddit社区的技术大V在基准测试中运行了MiniMax M2,“它获得了58.3%的分数,这是一个相当不错的成绩”。CoreViewHQ联合创始人兼CTO Ivan Fioravant表示,“MiniMax-M2的表现相当出色!甚至比Claude 4.1 Opus还要好,即使在实际使用中也令人印象深刻”。海外个人开发者接入API进行了广泛测试,并在技术社区分享了真实案例。
OpenRouter作为全球最具影响力的AI模型聚合与调用平台之一,其数据来源于真实开发者的使用行为,具有代表性和权威性。M2在其平台上线不到两天,模型调用量已跻身全球前十。MiniMax方面向澎湃新闻记者表示,M2专为编码与智能体任务深度优化,具备强大的端到端开发与执行能力,可实现多代码文件的自动调试与修复。这款只有10B激活参数(总参数230B)的轻量级模型,在保持卓越性能的同时,实现了更低的延迟与成本,以及更高的吞吐效率,完美契合了新兴多智能体工作流对高效协同与快速响应的需求。
凭借其在代码生成、工具调用和深度搜索方面的卓越能力,M2有望在国内金融、工业、医疗、教育、文化等多个行业的智能化转型中扮演关键角色。据MiniMax透露,M2发布后两周内将开放全球API接口免费调用,此外还将上线国内版MiniMax Agent,拥有“高效”与“专业”双模式——前者适用于轻量级对话、基础编码等场景,后者则针对全栈开发、专业PPT制作等复杂需求优化,实现不同场景下的高效化。MiniMax Agent在网页端与App限时免费,将普惠进行到底。
中国开源大模型的实力已经引起了全球的关注。据外媒报道,中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低。业内人士认为,中国在开源大模型上的突出表现,将进一步提升中国在AI产业的话语权,引导全球更多开发者使用,有利于AI整体生态的开放和完善。未来,中国在开源大模型上的竞争力将继续加强,也将推动行业竞争更加激烈。
(以上内容均由Ai生成)