阿里推出新推理模型Qwen3-30B-A3B-Thinking-2507，多项能力显著提升

发布时间：2025年7月31日来源：szf

快速阅读: 据《IT之家 – 电脑频道》称，7月31日，阿里通义千问推出新推理模型Qwen3-30B-A3B-Thinking-2507，该模型在数学、代码等核心推理能力及知识水平上超越同类模型，支持更长上下文理解和多语言指令，已在魔搭社区和HuggingFace开源，并在Qwen Chat上线。

7月31日，阿里通义千问宣布推出全新推理模型Qwen3-30B-A3B-Thinking-2507。相比4月29日开源的Qwen3-30-A3B模型，新模型在推理能力、通用能力和上下文长度方面均有显著提升。新模型在数学能力评测AIME25中获得85.0的高分，在代码能力测试LiveCodeBench v6中得分为66.0，这两项核心推理能力均超越Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。新模型的知识水平（GPQA、MMLU-Pro）也比上一版本有显著提高。

在写作（WritingBench）、Agent能力（BFCL-v3）、多轮对话和多语言指令遵循（MultiIF）等通用能力评测中，Qwen3-30B-A3B-Thinking-2507同样超越了Gemini2.5-Flash(thinking)和Qwen3-235B-A22B(thinking)。新模型支持更长的上下文理解，原生支持256K tokens，可扩展至1M tokens。此外，新模型的思考长度也有所增加，官方建议在处理高度复杂的推理任务时，设置更长的思考预算，以充分发挥其潜力。

官方透露，Qwen3-30B-A3B-Thinking-2507已在魔搭社区和HuggingFace上开源，其轻量体积便于在消费级硬件上本地部署。同时，该模型也在Qwen Chat上同步上线。

(以上内容均由Ai生成)