阿里推出新推理模型Qwen3-30B,多项能力显著提升
快速阅读: 据《IT之家 – 电脑频道》称,7月31日,阿里巴巴推出全新推理模型Qwen3-30B-A3B-Thinking-2507,该模型在数学、代码等核心推理能力及写作、多轮对话等通用能力上超越前代,支持更长上下文理解,已开源并在Qwen Chat上线。
7月31日,阿里巴巴宣布推出全新推理模型Qwen3-30B-A3B-Thinking-2507。相比4月29日发布的Qwen3-30-A3B模型,新模型在推理能力、通用能力和上下文长度方面均有显著提升。新模型在数学能力评测AIME25中获得85.0分,在代码能力测试LiveCodeBench v6中得分为66.0,这两项核心推理能力均超越Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。
在写作能力、Agent能力、多轮对话和多语言指令遵循等通用能力评测中,Qwen3-30B-A3B-Thinking-2507同样超过了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。新模型支持更长的上下文理解,原生支持256K tokens,并可扩展至1M tokens。此外,新模型的思考长度也有所增加,官方建议在处理复杂推理任务时设置更长的思考预算,以充分利用其潜力。
目前,Qwen3-30B-A3B-Thinking-2507已在魔搭社区和HuggingFace上开源,轻量级设计使其能够在消费级硬件上轻松部署。同时,该模型已上线Qwen Chat。
(以上内容均由Ai生成)