阿里云推出Qwen3-Max，性能领先行业

发布时间：2025年9月24日来源：szf

快速阅读: 阿里云发布Qwen3-Max，参数超1万亿，提升多项技术能力。Instruct版在编程、推理等领域领先，Thinking版推理测试准确率达100%。训练使用36万亿tokens，效率显著提升。

在人工智能领域的激烈竞争中，阿里云再次发力，正式推出其最新AI语言模型——Qwen3-Max。该模型不仅是通义团队迄今为止规模最大、能力最强的产品，其参数总量超过1万亿，显著提升了多项技术能力，为业界带来了新的震撼。

Qwen3-Max-Instruct版本在代码能力、智能体表现等方面实现了质的飞跃，尤其在知识推理、编程能力、指令遵循和多语言理解等多个领域，Qwen3-Max的表现均处于行业领先地位。阿里云的通义团队还透露，另一款正在训练中的Qwen3-Max-Thinking版本已展现出非凡潜力，预计不久将与公众见面。这一“思考”版本在高难度推理测试中取得了100%的准确率，展示了其出色的推理能力。

在训练方面，Qwen3-Max模型的预训练使用了36万亿个tokens，得益于其独特的MoE模型结构设计，训练过程既稳定又高效。通过PAI-FlashMoE的优化，Qwen3-Max的训练效率显著提升，能够支持长达1百万的上下文训练。同时，阿里云还通过多种技术手段减少了因硬件故障造成的时间损失，确保了训练的高效进行。

在实际应用中，Qwen3-Max-Instruct已在LMArena的文本排行榜上稳居全球前三，超越了著名的GPT-5-Chat。在专注于现实编程挑战的SWE-Bench Verified基准测试中，Qwen3-Max-Instruct取得了69.6的高分，显示了其卓越的编程能力。在智能体工具调用能力测试Tau2-Bench中，Qwen3-Max-Instruct也以74.8分的优异成绩，成功超越了Claude Opus4和DeepSeek-V3.1。

综上所述，阿里云的Qwen3-Max不仅在技术参数上领先，更在应用性能上展现了强大的能力，为人工智能的未来发展注入了新的动力。

(以上内容均由Ai生成)