阿里推出Qwen3-Coder 开源AI模型助力高效编程
快速阅读: 据相关媒体最新报道,7月23日,阿里巴巴发布开源AI编程模型Qwen3-Coder,采用MoE架构,支持256K token,表现优异,已在多个平台开源。
7月23日清晨,阿里巴巴正式发布了全新开源AI编程模型——Qwen3-Coder。这款模型采用混合专家(MoE)架构,拥有480亿参数,其中可激活参数达35亿,标志着千问系列的重大突破。
Qwen3-Coder在一个包含7.5TB数据、代码占比70%的数据集上进行了预训练,支持256K token的上下文,最高可扩展至1M token,适用于多种编程场景。通过后期的强化学习,该模型在编程任务和智能体任务方面进行了深度优化,显著提升了通用能力、代码能力和Agent能力。
在多个评测中,Qwen3-Coder表现出色。在WebArena等平台的Agent能力评测中,它超越了GPT4.1;在SWE-Bench评测中,更是取得了开源模型的最佳成绩。其出色的Agent能力使它能够处理复杂的多步骤任务,自主安排工作内容,灵活调用工具,高效解决复杂编程任务。
Qwen3-Coder还大幅降低了编程的入门门槛,普通人也能轻松实现编程愿望。开发者只需简单指令,即可生成复杂的3D物理模拟过程,将原本需要数小时的任务缩短至几分钟,显著提高编程效率,并推动网页开发、AI搜索等多个智能应用领域的发展。
目前,Qwen3-Coder已在魔搭社区、HuggingFace等平台开源,全球开发者可免费下载使用。此外,它还将接入阿里的AI编程产品通义灵码,并上线阿里云百炼API,方便开发者使用。为了提升用户体验,通义团队还推出了一款命令行工具Qwen Code,帮助开发者更好地利用这一强大工具。
(以上内容均由AI生成)