阿里支持的Moonshot AI发布Kimi K2,超越GPT-5

发布时间:2025年11月7日    来源:szf
阿里支持的Moonshot AI发布Kimi K2,超越GPT-5

快速阅读: 阿里巴巴支持的Moonshot AI发布Kimi K2 Thinking模型,超越GPT-5等领先系统,具备320亿参数激活能力,支持256,000标记上下文窗口,成本低于竞品,促进AI技术普及。

阿里巴巴支持的中国初创公司Moonshot AI于11月6日发布了其最新的人工智能模型Kimi K2 Thinking。该模型在关键推理和编码基准测试中超越了多个领先的AI系统,包括OpenAI的GPT-5和Claude Sonnet 4.5。

Moonshot表示,该模型每次推理激活320亿个参数,总计一万亿个参数,并支持高达256,000个标记的上下文窗口。该模型能够在无人干预的情况下执行200到300次连续的工具调用。

基准测试结果显示,Kimi K2 Thinking在启用工具的人类最后一考基准上得分为44.9%,在BrowseComp网络搜索推理基准上得分为60.2%,在评估代理推理和编码能力的SWE-bench Verified基准上得分为71.3%。

Moonshot指出,Kimi K2 Thinking专为显式推理设计,其中间逻辑步骤在输出中可见,以确保多步工作流程的透明度。尽管其规模达到一万亿参数,Moonshot AI解释说,Kimi K2 Thinking仍能保持较低的运行成本。该公司列出的价格为每百万标记缓存命中0.15美元,缓存未命中0.60美元,输出2.50美元。

这些价格即使与MiniMax-M2的输入0.30美元和输出1.20美元相比也具有竞争力,且比GPT-5的输入1.25美元和输出10美元低一个数量级。该开源模型在修改版MIT许可证下提供,允许免费商业使用,但在大规模部署时需满足一项归属条件。

Kimi K2 Thinking的推出正值中国开源AI企业在与美国专有系统竞争中越来越接近之时。Moonshot AI认为,该模型是实现强大AI技术更广泛可及性的关键一步。

(以上内容均由Ai生成)

你可能还想读

小鹏工程师现场拆解机器人腿证明其真实性

小鹏工程师现场拆解机器人腿证明其真实性

快速阅读: 小鹏汽车在广州展示从电动车向人形机器人、自动驾驶出租车和飞行汽车转型,推出最新版人形机器人铁人,其逼真行走能力引发关注,计划明年大规模生产。 本周,小鹏汽车在中国广州总部举办了一场特别活动,展示了其从电动汽车制造商向更宏伟目标的 […]

发布时间:2025年11月7日
OpenAI澄清未求政府担保,美股科技股应声下跌

OpenAI澄清未求政府担保,美股科技股应声下跌

快速阅读: OpenAI CEO山姆·奥特曼紧急澄清,否认寻求政府为数据中心提供担保,强调政府不应干预市场选择。此言缓解了市场担忧,科技股跌幅收窄。 OpenAI转发首席财务官萨拉·弗莱尔的澄清声明 OpenAI紧急下场澄清。 当地时间11 […]

发布时间:2025年11月7日
苏姿丰透露 AMD 拓展 AI 客户圈,拟与多家大客户合作

苏姿丰透露 AMD 拓展 AI 客户圈,拟与多家大客户合作

快速阅读: AMD CEO苏姿丰透露,公司正与多家客户洽谈类似OpenAI的合作,旨在扩大客户基础,降低业务风险。Instinct MI355系列已投产,MI450系列计划2026年下半年上市,目标缩小与英伟达的性能差距。 11 月 7 日 […]

发布时间:2025年11月7日
英特尔AI高管离职转投AMD,DCAI团队重组

英特尔AI高管离职转投AMD,DCAI团队重组

快速阅读: 英特尔数据中心AI产品管理副总裁Saurabh Kulkarni离职,将加入AMD;AI产品管理组织由Anil Nanduri接管。Kulkarni曾负责Gaudi AI加速器项目。 IT之家11月7日消息,英特尔于当地时间4日 […]

发布时间:2025年11月7日
OpenAI发布青少年AI安全标准,强调年龄差异化保护

OpenAI发布青少年AI安全标准,强调年龄差异化保护

快速阅读: OpenAI发布青少年AI安全标准蓝图,提出五项建议,包括年龄差异化处理、禁止展示有害内容、提供家长控制工具,以保护青少年安全。 OpenAI 于本周四发布了一份针对青少年使用人工智能的安全标准蓝图,旨在引导公众和立法者关注青少 […]

发布时间:2025年11月7日
​社交平台 X 引入 AI 辅助核查,用户信息真实度或将提升

​社交平台 X 引入 AI 辅助核查,用户信息真实度或将提升

快速阅读: 社交平台X采用AI进行内容核查,约10%社区注释由AI生成。近期一AI错误标注抗议视频时间,引发质疑。AI与用户共核查,提升信息真实度。 社交平台 X(原 Twitter)最近开始大规模采用人工智能(AI)进行内容核查,提升用户 […]

发布时间:2025年11月7日
科大讯飞推出全新深度推理大模型:星火 X1.5,性能再创新高!

科大讯飞推出全新深度推理大模型:星火 X1.5,性能再创新高!

快速阅读: 科大讯飞发布最新深度推理大模型讯飞星火X1.5,采用MoE架构,参数量293亿,推理效率提升100%,数学能力超GPT-5,支持130多种语言,性能达ChatGPT-5的95%以上。 近日,科大讯飞正式发布了其 最新 的深度推理 […]

发布时间:2025年11月7日
Meta全AI短视频Vibes进军欧洲,引发“AI泔水”争议

Meta全AI短视频Vibes进军欧洲,引发“AI泔水”争议

快速阅读: Meta将全AI生成短视频产品Vibes扩展至欧洲市场,强调社交化和协作式体验,但与之前强调真实内容立场相悖,引发用户质疑和负面评论,面临“内容膨胀”危机。 继在美国上线六周后,Meta正式将旗下全AI生成短视频产品Vibes推 […]

发布时间:2025年11月7日