阿里通义千问发布轻量级Qwen3-VL,性能媲美72B旗舰
快速阅读: 阿里巴巴通义千问团队发布Qwen3-VL系列4B和8B参数轻量级模型,降低部署门槛,保持高性能,适用于消费级和边缘设备,性能超越同规模竞品。
近日,阿里巴巴通义千问团队发布了Qwen3-VL系列的两款轻量级模型——4B和8B参数版本。这是通义千问迄今为止推出的能力最强的视觉语言模型家族,首次亮相于上个月。此次推出的小参数版本旨在降低部署门槛,同时保持高性能表现。
新发布的模型提供4B和8B两种参数规模,每种规模均有Instruct(指令遵循)和Thinking(思维链推理)两个版本,为开发者提供了更加灵活的选择。这些模型在保持完整功能的同时,显著减小了体积。
在技术层面,新模型实现了三大核心目标:一是大幅减少了硬件资源需求,参数规模的减少使得显存占用显著下降,便于在各种消费级和边缘设备上部署;二是尽管模型尺寸缩小,但继承了Qwen3-VL系列的所有关键能力,如多模态理解、长文本处理和复杂推理等功能;三是性能方面,新模型在多个权威基准测试中表现出色,超越了同规模竞品,在STEM学科问答、视觉问答(VQA)、光学字符识别(OCR)、视频理解和Agent任务等多个场景中,不仅超过了Google Gemini2.5 Flash Lite和OpenAI GPT-5 Nano等轻量级模型,在某些任务上甚至接近半年前发布的72B参数旗舰模型Qwen2.5-VL-72B的水平。
此次发布标志着大模型小型化的又一重要进展。通过模型压缩和优化技术,开发团队在保持功能完整性的同时,大幅削减了参数量和计算成本,为视觉语言模型在移动设备、物联网设备等资源受限环境中的应用开辟了新路径。对于需要本地部署或对推理成本敏感的企业用户来说,这两款新模型提供了更具性价比的解决方案。模型详情可访问:https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe
(以上内容均由Ai生成)