阿里通义千问升级:Qwen3-30B性能比肩GPT-4,多领域能力大幅提升
快速阅读: 据相关媒体最新报道,阿里通义千问推出Qwen3-30B-A3B-Instruct-2507新版本,激活参数33亿,性能接近GPT-4。支持262144 tokens上下文,提升多语言和开放任务表现。
据阿里通义千问今日发布的消息,7月30日,阿里通义千问推出了Qwen3-30B-A3B-Instruct-2507的新版本。该版本主要提升了指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力。官方称,在激活33亿参数的情况下,性能接近GPT-4和Qwen3-235B-A22B Non-Thinking。
新模型的参数总量为305亿,其中激活参数为33亿,非嵌入层数量为299亿,网络层数为48层,专家数为128个,激活专家数为8个,上下文长度支持262144个tokens。该模型仅支持非思考模式,输出中不会生成块,也不再需要指定enable_thinking=False。
官方表示,新模型大幅增加了多种语言的长尾知识覆盖,且在主观和开放式任务中与用户偏好更加一致,能够提供更有帮助的回答和更高质量的文本生成。
(以上内容均由AI生成)