阿里云发布Qwen3-Max:超大规模AI模型,代码生成与智能体能力显著提升
快速阅读: 阿里云Qwen团队发布Qwen3-Max,参数超1万亿,训练效率提升30%,在多个基准测试中领先,尤其在代码生成和智能体能力方面表现突出,支持1百万长上下文训练。
阿里云旗下的Qwen团队宣布推出最新AI模型——Qwen3-Max。这款模型以其超大规模和强大功能,标志着人工智能技术的重大突破。Qwen3-Max不仅在LMArena文本排行榜上位居第三,超越了竞争对手GPT-5-Chat,还在多个基准测试中表现出色,特别是在代码生成和智能体能力方面。
Qwen3-Max模型的总参数超过1万亿,预训练使用了36万亿个tokens。得益于Qwen3系列先进的MoE模型结构设计,Qwen3-Max在训练稳定性和高效性方面取得了显著进展。通过创新的PAI-FlashMoE多级流水并行策略,该模型的训练效率相比之前版本提高了30%。在长序列训练场景中,Qwen3-Max采用的ChunkFlow策略使吞吐量提高了3倍,支持1百万长上下文的训练。
Qwen3-Max-Instruct是这一系列模型中的重要部分,在编程基准测试SWE-Bench Verified中获得了69.6分的优异成绩,证明了其在实际编程挑战中的出色能力。此外,该模型在Tau2-Bench基准测试中以74.8分的成绩,超越了Claude Opus4和DeepSeek-V3.1,显示了其在智能体工具调用能力方面的突破性表现。
值得一提的是,Qwen3-Max的推理增强版本——Qwen3-Max-Thinking,凭借集成的代码解释器和并行计算技术,在极具挑战性的数学推理基准测试AIME25和HMMT中取得了满分的优异成绩。团队对这一版本的前景充满信心,期待尽快将其推向市场。
Qwen团队表示,用户现在可以通过阿里云API直接体验Qwen3-Max-Instruct模型的强大功能。相关API已开放,使用者只需简单几步即可注册和获取API密钥,调用Qwen3-Max进行开发。
Qwen3-Max的发布不仅推动了AI技术的发展,也为开发者提供了更强大的工具,助力他们在各行各业创造更多价值。随着这一技术的普及,Qwen团队相信,人工智能的未来将更加光明。
(以上内容均由Ai生成)