Kimi K2 抢先开源并自夸论文署名
快速阅读: 据相关媒体报道,月之暗面发布开源大模型Kimi K2,参数达万亿级,技术报告称其基于DeepSeek V3改进,包含Muonic优化器等创新,旨在推动“智能体时代”发展。
据36氪报道,上周,月之暗面团队发布了全新版本的大模型Kimi K2。这是目前世界上首个参数量达到万亿级别的开源模型,发布后迅速引起业内关注。Kimi K2不仅在各项评估基准上表现出色,还赢得了国内外开发者社区的好评,在LMSYS的开源模型排行榜上跃居首位。
然而,也有声音质疑Kimi K2涉嫌“抄袭”DeepSeek。对此,Kimi团队坦承确实在DeepSeek V3的基础上进行了改进。一些网友更是直接对比了两者的架构,指出具体的不同之处。
近日,Kimi团队又发布了一份技术报告,详细介绍了Kimi K2的技术细节。报告中提到的关键点包括:万亿参数的混合专家模型、Muonic优化器、Agentic智能等。尤其值得一提的是,Kimi K2的技术报告中,Kimi K2本身也被列为作者之一,这一举动引发了广泛讨论。
Kimi K2旨在推动“智能体时代”的到来,从“会聊天”到“能干活”,模型不仅要在考试中取得高分,更需具备在复杂环境中自我进化的“实习生”能力。其技术创新包括Muonic优化器、稀疏MoE架构及改写数据策略,共同解决了“高质量数据稀缺”时代的超大规模训练难题。此外,Kimi K2还提供了合成与真实数据相结合的十万个工具轨迹,为社区贡献了宝贵的智能体数据资源。
Kimi K2的开源意义重大,它不仅刷新了多个基准测试的成绩,还为后续的研究与应用奠定了坚实基础。预计2025年下半年,基于Kimi K2的改进,将有一批更加实用的垂直智能体涌现,真正将大模型从“聊天框”带入“生产线”。
(以上内容均由AI生成)