月之暗面开源Kimi K2Thinking，460万美元训练成本登顶HLE

发布时间：2025年11月10日来源：szf

快速阅读: Moonshot AI 开源最强思考型大模型 Kimi K2Thinking，以 44.9% 成绩领先国际，训练成本仅 460 万美元，远低于行业平均水平，性能卓越且全面开源，降低 AI 应用门槛。

国产大模型再出重磅。本周四，Moonshot AI 正式开源其最强思考型大模型 Kimi K2Thinking。该模型不仅在权威基准“人类终极考试”（HLE）中以 44.9% 的得分领先 GPT-5、Grok-4 和 Claude 4.5 等国际闭源巨头，而且仅以 460 万美元（约合 3277 万元人民币）的训练成本，引发了一场高性价比的 AI 革命。

这一成就尤其令人瞩目的是其卓越的成本控制。据 CNBC 引述知情人士透露，Kimi K2Thinking 的训练投入远低于 DeepSeek V3 的 560 万美元，更与 OpenAI 动辄数十亿美元的研发开支形成鲜明对比。在 AI 行业普遍陷入“算力军备竞赛”的背景下，Moonshot AI 用实际行动证明：更强的智能并不一定依赖更高的投入。

除了性能卓越，Moonshot AI 还选择了全面开源。与大多数闭源模型不同，Moonshot AI 不仅公开了模型权重，还发布了完整的训练脚本、数据配比方案及评估工具链，并明确允许商用。这使得开发者可以零成本复现、微调甚至部署企业级应用，极大地降低了 AI 落地的门槛。在当前开源生态亟需高质量中文思考模型的背景下，Kimi K2Thinking 无疑填补了关键空白。

所谓的“思考模型”，不仅强调语言生成能力，更注重复杂的推理、多步规划和知识整合能力。“人类终极考试”（HLE）是衡量模型是否具备类人综合智能的严苛测试，涵盖逻辑、常识、数学和伦理等多个维度。Kimi K2 在此项测试中登顶，标志着国产模型已从“答得快”迈向“想得深”的新阶段。

AIbase 认为，Moonshot AI 的这一举措不仅是一次技术突破，更是对全球大模型发展路径的重新定义。开源、高效、可商用的组合，或将推动 AI 从“巨头游戏”回归“开发者生态”。当 460 万美元就能训练出超越 GPT-5 的模型时，AI 的未来或许将由更聪明、更务实的中国团队书写。

(以上内容均由Ai生成)