月之暗面开源Kimi K2Thinking,460万美元训练成本登顶HLE
快速阅读: Moonshot AI 开源最强思考型大模型 Kimi K2Thinking,以 44.9% 成绩领先国际,训练成本仅 460 万美元,远低于行业平均水平,性能卓越且全面开源,降低 AI 应用门槛。
国产大模型再出重磅。本周四,Moonshot AI 正式开源其最强思考型大模型 Kimi K2Thinking。该模型不仅在权威基准“人类终极考试”(HLE)中以 44.9% 的得分领先 GPT-5、Grok-4 和 Claude 4.5 等国际闭源巨头,而且仅以 460 万美元(约合 3277 万元人民币)的训练成本,引发了一场高性价比的 AI 革命。
这一成就尤其令人瞩目的是其卓越的成本控制。据 CNBC 引述知情人士透露,Kimi K2Thinking 的训练投入远低于 DeepSeek V3 的 560 万美元,更与 OpenAI 动辄数十亿美元的研发开支形成鲜明对比。在 AI 行业普遍陷入“算力军备竞赛”的背景下,Moonshot AI 用实际行动证明:更强的智能并不一定依赖更高的投入。
除了性能卓越,Moonshot AI 还选择了全面开源。与大多数闭源模型不同,Moonshot AI 不仅公开了模型权重,还发布了完整的训练脚本、数据配比方案及评估工具链,并明确允许商用。这使得开发者可以零成本复现、微调甚至部署企业级应用,极大地降低了 AI 落地的门槛。在当前开源生态亟需高质量中文思考模型的背景下,Kimi K2Thinking 无疑填补了关键空白。
所谓的“思考模型”,不仅强调语言生成能力,更注重复杂的推理、多步规划和知识整合能力。“人类终极考试”(HLE)是衡量模型是否具备类人综合智能的严苛测试,涵盖逻辑、常识、数学和伦理等多个维度。Kimi K2 在此项测试中登顶,标志着国产模型已从“答得快”迈向“想得深”的新阶段。
AIbase 认为,Moonshot AI 的这一举措不仅是一次技术突破,更是对全球大模型发展路径的重新定义。开源、高效、可商用的组合,或将推动 AI 从“巨头游戏”回归“开发者生态”。当 460 万美元就能训练出超越 GPT-5 的模型时,AI 的未来或许将由更聪明、更务实的中国团队书写。
(以上内容均由Ai生成)