DeepSeek丢冠，中国新星Kimi K2接棒

发布时间：2025年7月18日来源：szf

快速阅读: 据相关媒体最新报道，Kimi K2模型超越DeepSeek，位列全球开源模型第一。其在多任务中表现优异，获Perplexity认可，团队回应称基于V3架构并优化参数。开源模型正逐步追平闭源模型。

据量子位报道，7月11日，全球开源模型竞技场更新了最新排名，中国团队开发的Kimi K2模型超越了DeepSeek，成为全球开源模型排名第一，总榜排名第五。K2模型在多个单项能力测试中表现优异，与顶尖闭源模型如GPT 4.5、Grok 4等不相上下。特别是在连续多轮对话、编程能力和应对复杂提示词方面，K2分别取得了第一、第二和第二的成绩。

Kimi K2在过去一周内受到了广泛关注，其在GitHub上获得了5.6K的标星，在Hugging Face上的下载量接近10万次。此外，AI搜索引擎明星企业Perplexity的CEO也公开表示，K2模型在其内部评估中表现出色，公司计划基于K2进行进一步的后训练。

然而，随着K2的热度上升，关于其是否采用了DeepSeek V3架构的质疑也随之而来。Kimi团队成员回应称，K2确实基于V3架构，但在参数调整上做了大量优化，以适应自身的需求。这些调整包括增加专家数量、减少注意力头数、只保留第一层Dense以及采用自由路由和动态重排技术，使得模型在性能提升的同时，成本控制更加合理。

此次Kimi K2的成功，标志着开源模型在性能上正逐步追平甚至超越闭源模型，打破了“开源模型性能弱”的传统观念。艾伦人工智能研究所的研究科学家Tim Dettmers认为，未来开源模型击败闭源模型将变得越来越常见。Perplexity CEO也在多个场合强调，开源模型在全球AI能力扩散中将发挥重要作用，特别是在定制化和本地化应用方面。

(以上内容均由AI生成)