快手开源KAT-V1大模型:40B版性能接近R1-0528

发布时间:2025年7月25日    来源:szf
快手开源KAT-V1大模型:40B版性能接近R1-0528

快速阅读: 据相关媒体报道,快手发布开源大模型KAT-V1,具备自动思考能力,40B版本性能接近DeepSeek-R1,200B版本超越Qwen、Llama等。

据快手公司宣布,7月25日,快手正式发布并开源了KAT-V1自动思考大模型。这款模型在思考与非思考能力的融合方面表现出色,能够根据问题的复杂度自动调整其思考模式。

KAT-V1提供40B和200B两个版本。其中,40B版本在自动思考模式下的性能接近最新发布的DeepSeek-R1(参数量为6850亿)。200B版本则在多项基准测试中超越了Qwen、DeepSeek和Llama系列的旗舰模型。

在实时基准测试LiveCodeBench Pro中,KAT-V1的40B版本成功跻身闭源模型行列,超越了众多开源模型。快手的Kwaipilot团队在技术报告中详细介绍了KAT-V1背后的技术创新,包括一种全新的长短思考混合模型训练范式,以及一种新型强化学习算法Step-SRPO,显著提升了模型的推理能力和思考密度。

自OpenAI推出o系列模型以来,推理模型的思考方式逐渐演变为“过度思考”,导致响应时间延长,用户体验下降。KAT-V1针对这一问题进行了优化,研究团队希望模型能够根据任务复杂度自主判断是否进行深入思考,从而实现更高效的人机协作。快手团队在今年6月推出的KwaiCoder-AutoThink-preview为解决此问题提供了初步方案,KAT-V1在此基础上进行了进一步的推理能力优化。

KAT-V1模型是在Qwen2.5-32B的基础上进行扩展的。团队构建了大量的思考与非思考数据,并在预训练阶段使用了约1000万个示例,以确保模型在科学、代码、数学等多个领域的泛化能力。通过独特的异构蒸馏框架,KAT-V1能高效地将教师模型的知识传递给学生模型,大大降低了模型初始化的成本。

在模型的后训练阶段,Kwaipilot团队通过强化学习方法提升模型的智能决策能力。KAT-V1能够通过学习,智能选择合适的思考模式,使得在复杂问题上,其性能可以达到DeepSeek-R1-0528的95%以上。

目前,KAT-V1的40B版本已在Hugging Face平台上线,用户也可以在快手打造的AI研发助手Kwaipilot中体验这一模型。200B版本的MoE模型仍在训练中,未来有望带来更强大的功能和应用。

(以上内容均由AI生成)

关键词: 40BKatR1v1快手

你可能还想读

openEuler发布首款SuperPoD就绪操作系统

openEuler发布首款SuperPoD就绪操作系统

快速阅读: 据最新消息,openEuler峰会2025在京举行,发布面向AI集群的24.03 LTS SP3版本及全栈AI方案,AMD等加入社区,全球三大芯片厂商齐聚,推动开源操作系统在多领域部署超1600万套。 11月14日至15日,操作 […]

发布时间:2025年12月10日
Netcall收购Jadu强化AI与数字能力

Netcall收购Jadu强化AI与数字能力

快速阅读: 12月10日消息,Netcall公司近日收购英国数字体验平台Jadu Holdings Limited,旨在增强其Liberty平台的数字化与AI能力,拓展英国地方政府及美国等国际市场,提升盈利与财务稳定性。 英国数字体验平台提 […]

发布时间:2025年12月10日
Pine Labs推印度首个AI账单支付助手

Pine Labs推印度首个AI账单支付助手

快速阅读: 最新消息显示,Pine Labs旗下Setu推出印度首个智能代理账单支付服务,可自动抓取账单、识别异常费用并在用户设定限额内完成支付,目前已上线Claude和ChatGPT平台。 12月10日,Pine Labs旗下API驱动平 […]

发布时间:2025年12月10日
IBM豪掷110亿美元收购Confluent加码AI数据流

IBM豪掷110亿美元收购Confluent加码AI数据流

快速阅读: 12月10日消息,IBM以110亿美元收购Confluent,获得Apache Kafka商业平台控制权,补足实时数据传输能力,结合红帽与HashiCorp技术,构建覆盖混合云环境的完整AI中间件体系。 国际商业机器公司(IBM […]

发布时间:2025年12月10日
2026年软件工程将全面迈入AI原生时代

2026年软件工程将全面迈入AI原生时代

快速阅读: 据媒体报道,荷兰科技企业Xebia推出AI原生工程平台ACE,可自动化50%至60%开发流程,提升交付速度40%、现代化效率70%,推动软件工程全面智能化转型。 随着人工智能技术加速演进,软件工程正迈向“AI原生”新阶段。业界观 […]

发布时间:2025年12月10日
微软宣布175亿美元投资印度AI基建

微软宣布175亿美元投资印度AI基建

快速阅读: 消息人士透露,微软宣布投资175亿美元支持印度AI基础设施建设,系其亚洲最大单笔投资,将分四年推进海得拉巴云区域等项目,助力构建“AI优先”生态体系。 微软公司近日宣布计划投资175亿美元,用于支持印度人工智能基础设施建设。该公 […]

发布时间:2025年12月10日
卡塔尔MCIT签约多家科技巨头推进AI政务转型

卡塔尔MCIT签约多家科技巨头推进AI政务转型

快速阅读: 据了解,卡塔尔通信和信息技术部与Malomatia、谷歌云、微软等六家企业签署战略合作协议,纳入GovAI计划,推动政府AI应用及数字项目建设,助力实现2030国家愿景。 卡塔尔通信和信息技术部近日宣布,与多家本地及国际科技企业 […]

发布时间:2025年12月10日
沃达丰卡塔尔高管开讲AI与网络安全

沃达丰卡塔尔高管开讲AI与网络安全

快速阅读: 据了解,沃达丰卡塔尔首席技术官博克托在巴尔赞大学学院讲座中指出,AI驱动的网络攻击正重塑安全威胁格局,运营商需借力机器学习与预测分析提升防御韧性,并加强产学研合作以支撑卡塔尔国家愿景2030。 近日,沃达丰卡塔尔公司首席技术官拉 […]

发布时间:2025年12月10日