Kimi K2 Thinking全球排名第二,开源模型中居首

发布时间:2025年11月8日    来源:szf
Kimi K2 Thinking全球排名第二,开源模型中居首

快速阅读: 人工智能分析公司Artificial Analysis报告显示,Kimi K2 Thinking在最新AI系统评估中排名全球第二,开源模型中居首。其AI智能指数67分,仅次于GPT-5,具备卓越推理能力。在编程基准测试中表现优异,成为新的开源领导者。

领先的人工智能分析公司Artificial Analysis发布的新报告显示,在最新的智能和代理AI系统评估中,Kimi K2 Thinking取得了全球第二高的排名,且在开源模型中位居第一。

强大的代理能力和推理能力

Kimi K2 Thinking在AI智能指数上得分为67分,超过了其他所有开源模型,如MiniMax-M2(61分)和DeepSeek-V3.2-Exp(57分),仅落后于GPT-5。这突显了其卓越的推理和解决问题的能力。在衡量AI工具使用和自主性的代理基准测试中,Kimi K2 Thinking排名仅次于GPT-5,在𝜏²-Bench Telecom测试中获得了93%的成绩——这是该公司记录的最高独立得分。在“人类最后的考试”这一不使用工具的推理测试中,Kimi K2 Thinking达到了22.3%,为开源模型创造了新的纪录,仅落后于GPT-5和Grok 4。

成为开源代码模型的新领导者

虽然在每个编程基准测试中不是最佳表现者,Kimi K2 Thinking仍然在Terminal-Bench Hard中排名第六,在SciCode中排名第七,在LiveCodeBench中排名第二。这些成绩使其在Artificial Analysis的代码索引中成为新的开源领导者,超越了DeepSeek V3.2。

技术规格:1万亿参数,INT4精度

Kimi K2 Thinking具有1万亿总参数和320亿活动参数(约594GB),支持256K上下文窗口,仅接受文本输入。它是Kimi K2 Instruct的推理变体,保持相同的架构,但使用INT4本地精度而非FP8。通过量化感知训练(QAT)实现的这种量化几乎将模型大小减半,显著提高了效率。

权衡:高冗长度、成本和延迟

Kimi K2 Thinking被描述为极其“健谈”,在测试期间生成了1.4亿个标记,是DeepSeek V3.2的2.5倍,GPT-5的两倍。尽管这种冗长性增加了推理成本和延迟,该模型仍提供具有竞争力的价格:

– 基础API:每百万输出标记2.5美元,总评估成本356美元

– Turbo API:每百万输出标记8美元,总评估成本1,172美元——仅次于Grok 4

处理速度从基础版本的每秒8个标记到Turbo版本的每秒50个标记不等。

报告总结称,诸如强化学习(RL)等后训练方法继续在推理和长期工具使用任务中推动显著的性能提升。

(以上内容均由Ai生成)

你可能还想读

中国机会|贝加莱:过去五年中国业务占比大幅提升,AI新品市场反馈超预期

中国机会|贝加莱:过去五年中国业务占比大幅提升,AI新品市场反馈超预期

快速阅读: 贝加莱大中华区总经理李昕表示,公司在华设立机器智能研究院,深化本地化战略,推动业绩显著增长,中国现为贝加莱全球第二大市场。本届进博会上展出基于AI数据建模的新品,获积极市场反馈。 “过去,贝加莱在总部奥地利以外的地区主要开展销售 […]

发布时间:2025年11月8日
Meta 计划三年内投资6000亿美元建设AI数据中心

Meta 计划三年内投资6000亿美元建设AI数据中心

快速阅读: Meta宣布未来三年将在美国投资约6000亿美元,重点建设AI数据中心,推动技术迈向“超级智能”。扎克伯格表示此举为提前布局产能,支撑AI技术研发与应用。 感谢IT之家网友 会弹琴的九号 的线索投递! IT之家 11 月 8 日 […]

发布时间:2025年11月8日
玩家改装华硕ROG显卡成滑板,展示散热器坚固耐用

玩家改装华硕ROG显卡成滑板,展示散热器坚固耐用

快速阅读: 网友在Reddit展示用华硕ROG夜神RTX 5080显卡改装的“滑板”,视频显示显卡坚固耐用,引发热议。TweakTown分析称显卡可能只是散热器,来源或为坏掉的显卡残件。 IT之家 11 月 8 日消息,网友 ashleys […]

发布时间:2025年11月8日
欧盟拟放宽AI法案,应对科技巨头压力

欧盟拟放宽AI法案,应对科技巨头压力

快速阅读: 欧盟委员会提议暂停部分人工智能法律,面临美国政府及科技公司压力。草案计划11月19日决定,将削弱数字规则手册,旨在提高竞争力。 欧盟委员会提议暂停其标志性人工智能法律的部分内容,此举是在大型科技公司和美国政府施加巨大压力下作出的 […]

发布时间:2025年11月8日
马斯克暗示特斯拉可能与英特尔合作生产AI芯片

马斯克暗示特斯拉可能与英特尔合作生产AI芯片

快速阅读: 特斯拉CEO马斯克表示,特斯拉可能建造巨大芯片工厂制造AI芯片,支持自动驾驶目标。马斯克透露正设计第五代AI芯片,可能与英特尔合作,但尚未签订协议。 特斯拉首席执行官埃隆·马斯克表示,特斯拉可能需要建造一座“巨大的芯片工厂”,以 […]

发布时间:2025年11月8日
富士康签约三菱电机,共同开发AI数据中心解决方案

富士康签约三菱电机,共同开发AI数据中心解决方案

快速阅读: 鸿海与三菱签署谅解备忘录,共同开发AI数据中心解决方案,利用双方专业知识促进全球能源效率高且可靠的解决方案供应。 台北,11月8日(中央社)台湾制造巨头鸿海精密工业股份有限公司预计将利用日本三菱电机公司在电力模块供应方面的优势, […]

发布时间:2025年11月8日
黄仁勋:没有台积电,英伟达不会成功

黄仁勋:没有台积电,英伟达不会成功

快速阅读: 英伟达CEO黄仁勋在台积电新竹活动上表示,Blackwell系列芯片市场需求强劲,该平台涉及多种芯片,对供应链提出高要求。黄仁勋感谢台积电支持,并称“没有台积电,英伟达不可能成功”。 IT之家 11 月 8 日消息,路透社发布博 […]

发布时间:2025年11月8日
甲骨文推出自主AI湖仓,打破云间壁垒

甲骨文推出自主AI湖仓,打破云间壁垒

快速阅读: Oracle在AI World活动上推出自主AI湖屋,结合自主数据库与Apache Iceberg,提供跨云分析互操作,消除供应商锁定,支持大规模数据处理。 在最近于拉斯维加斯举行的Oracle AI World活动上,该公司将 […]

发布时间:2025年11月8日