阿里通义千问更新:Qwen3-30B性能比肩GPT-4,多领域能力大幅提升
快速阅读: 据相关媒体最新报道,阿里通义千问发布Qwen3-30B-A3B-Instruct-2507新版本,提升多方面能力,支持非思考模式,性能接近GPT-4。
据阿里通义千问官方消息,7月30日,阿里通义千问发布了Qwen3-30B-A3B-Instruct-2507的新版本。这款更新后的模型主要提升了指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力。官方表示,在激活33亿参数的情况下,其性能接近GPT-4和Qwen3-235B-A22B Non-Thinking。
新模型的参数总量为305亿,其中激活参数为33亿,非嵌入层数量为299亿,网络层数为48层,专家数为128个,激活专家数为8个,上下文长度原生支持262144个tokens。该模型仅支持非思考模式,输出中不会生成块,也不再需要指定enable_thinking=False。
官方称,新模型大幅增加了多种语言的长尾知识覆盖,并在主观和开放式任务中与用户偏好更加一致,能够提供更有帮助的回答和更高质量的文本生成。
(以上内容均由AI生成)