DeepSeek失去开源榜首,中国新秀Kimi K2接棒
快速阅读: 据相关媒体最新报道,中国Kimi K2模型超越DeepSeek,位列全球开源模型第五。其性能媲美闭源模型,获Perplexity高度评价。团队承认借鉴DeepSeek V3架构并进行优化。开源模型正逐步赶超闭源模型,推动AI发展。
据量子位报道,7月11日,中国,Kimi K2 模型在全球开源模型排行榜上超越 DeepSeek,荣登榜首,总榜排名第五,紧随马斯克的 Grok 4 等顶尖闭源模型之后。这款由中国团队开发的模型,在多项能力测试中表现出色,与多个闭源模型不相上下,如连续多轮对话、编程能力和应对复杂提示词等方面。
Kimi K2 自发布以来备受关注,一周内 GitHub 获得超过 5600 颗星,Hugging Face 下载量接近 10 万次。此外,AI 搜索引擎公司 Perplexity 的 CEO 也对其给予了高度评价,并透露公司计划基于 K2 模型进行进一步的后训练。
然而,Kimi K2 的成功也引发了关于其架构来源的讨论。针对外界关于 K2 采用 DeepSeek V3 架构的质疑,Kimi 团队成员解释称,确实继承了 V3 架构,但在参数上进行了优化调整,以适应自身的需求。这些调整包括增加专家数量、减少注意力头数、仅保留第一层 Dense 结构以及专家不分组等,旨在提高模型性能的同时控制成本。
此次 Kimi K2 的崛起,标志着开源模型在性能上正逐步赶上甚至超越闭源模型。艾伦人工智能研究所的研究科学家 Tim Dettmers 和 Perplexity CEO 均表示,开源模型将在推动 AI 技术普及和发展方面发挥重要作用。尤其是中国产的开源模型,其在国际上的表现愈发亮眼,为全球 AI 领域贡献了重要力量。
(以上内容均由AI生成)