MiniMax M1 模型从 DeepSeek 获得中国 LLM 桂冠 – 而且它是真正的开源

发布时间：2025年6月19日来源：szf

快速阅读: 据《The Register》称，博客文章称，M1 在多个基准测试（AIME 2024、LiveCodeBench 等）中表现不俗，但也有差异。厂商提供数据仅供参考，源代码已上传 GitHub 供独立验证。

博客文章指出，M1 在多项基准测试（AIME 2024、LiveCodeBench、SWE-bench 验证版、Tau-bench 以及 MRCR）中的表现相当出色。某些模型的表现更为优异，而另一些则略显逊色。不过，厂商所提供的基准测试结果仅作参考之用。如果您希望自行验证其性能，相关源代码已经发布在 GitHub 平台上，供您查阅。

M1 的性能在这些测试中可圈可点。有些模型脱颖而出，而其他一些则稍显平淡。然而，厂商给出的数据仅供大家初步了解，想要深入评估，您可以亲自研究。为此，厂商贴心地在 GitHub 上公开了源代码，方便有需求的人士进行独立验证。

文中提到的基准测试包括 AIME 2024、LiveCodeBench、SWE-bench 验证版、Tau-bench 以及 MRCR。从结果来看，部分模型展现了令人眼前一亮的实力，而另一些则显得略逊一筹。尽管厂商提供了数据作为参考，但为了确保公正性和透明度，他们还将源代码上传至 GitHub，供外界自行检验和分析。

无论是在 AIME 2024、LiveCodeBench 还是 SWE-bench 验证版、Tau-bench 或 MRCR 中，M1 的表现均值得称道。一些模型脱颖而出，而另一些则稍显不足。尽管厂商提供了官方数据作为参考，但若想深入了解，大家可以前往 GitHub 查看源代码，以便独立验证其性能。

(以上内容均由Ai生成)