阿里巴巴发布新AI模型 通义Qwen3性能比肩GPT-4
快速阅读: 据相关媒体报道,7月30日,阿里巴巴发布开源模型Qwen3-30B-A3B-Instruct-2507,性能媲美GPT-4和Gemini 2.5-Flash,支持多语言,长文本处理达256K。
7月30日,阿里巴巴通义千问团队正式发布了Qwen3系列模型的新成员——Qwen3-30B-A3B-Instruct-2507。这款开源模型采用非思考模式,只需激活30亿参数,即可在多个核心能力上与Gemini2.5-Flash和GPT-4等知名闭源模型相媲美。此外,Qwen3-30B-A3B-Instruct-2507在多语言支持、用户偏好对齐和长文本处理方面也取得了显著进展。
该模型已在魔搭社区(ModelScope)和HuggingFace平台上全面开源。作为Qwen3-30B-A3B系列的最新版本,Qwen3-30B-A3B-Instruct-2507不仅继承了通义千问团队在架构创新上的优势,还大幅降低了计算成本,力求达到与千亿级闭源模型相当的性能。
根据官方数据,Qwen3-30B-A3B-Instruct-2507在数学推理、代码生成、研究生级物理与天文学问题及人类偏好对齐等多个关键基准测试中表现出色,部分指标甚至超过了GPT-4。这标志着该模型在逻辑推理、数学、科学和编程等多个领域的全面能力得到了显著提升。
更值得注意的是,Qwen3-30B-A3B-Instruct-2507在多语言的长尾知识覆盖上表现出色,并在主观和开放任务中更好地对齐用户偏好,生成更高质量的文本,提供更有价值的答案。其长文本理解能力也提升至256K,用户可以处理更加复杂的文本内容。
自2023年发布以来,通义千问系列模型已开源超过200个,全球下载量突破3亿次,衍生模型数量超过10万个,展示了强大的市场影响力和技术潜力。
(以上内容均由AI生成)