阿里云发布Qwen3-Max：超大规模AI模型，代码生成与智能体能力显著提升

发布时间：2025年9月24日来源：szf

快速阅读: 阿里云Qwen团队发布Qwen3-Max，参数超1万亿，训练效率提升30%，在多个基准测试中领先，尤其在代码生成和智能体能力方面表现突出，支持1百万长上下文训练。

阿里云旗下的Qwen团队宣布推出最新AI模型——Qwen3-Max。这款模型以其超大规模和强大功能，标志着人工智能技术的重大突破。Qwen3-Max不仅在LMArena文本排行榜上位居第三，超越了竞争对手GPT-5-Chat，还在多个基准测试中表现出色，特别是在代码生成和智能体能力方面。

Qwen3-Max模型的总参数超过1万亿，预训练使用了36万亿个tokens。得益于Qwen3系列先进的MoE模型结构设计，Qwen3-Max在训练稳定性和高效性方面取得了显著进展。通过创新的PAI-FlashMoE多级流水并行策略，该模型的训练效率相比之前版本提高了30%。在长序列训练场景中，Qwen3-Max采用的ChunkFlow策略使吞吐量提高了3倍，支持1百万长上下文的训练。

Qwen3-Max-Instruct是这一系列模型中的重要部分，在编程基准测试SWE-Bench Verified中获得了69.6分的优异成绩，证明了其在实际编程挑战中的出色能力。此外，该模型在Tau2-Bench基准测试中以74.8分的成绩，超越了Claude Opus4和DeepSeek-V3.1，显示了其在智能体工具调用能力方面的突破性表现。

值得一提的是，Qwen3-Max的推理增强版本——Qwen3-Max-Thinking，凭借集成的代码解释器和并行计算技术，在极具挑战性的数学推理基准测试AIME25和HMMT中取得了满分的优异成绩。团队对这一版本的前景充满信心，期待尽快将其推向市场。

Qwen团队表示，用户现在可以通过阿里云API直接体验Qwen3-Max-Instruct模型的强大功能。相关API已开放，使用者只需简单几步即可注册和获取API密钥，调用Qwen3-Max进行开发。

Qwen3-Max的发布不仅推动了AI技术的发展，也为开发者提供了更强大的工具，助力他们在各行各业创造更多价值。随着这一技术的普及，Qwen团队相信，人工智能的未来将更加光明。

(以上内容均由Ai生成)