阿里通义Qwen3-Omni登顶Hugging Face，全模态大模型创多项第一

发布时间：2025年9月29日来源：szf

快速阅读: 9月28日，Hugging Face公布最新模型榜单，阿里巴巴通义7款模型上榜，Qwen3-Omni登顶。该模型首度实现音视频与文本图像处理高性能结合，极大提升AI交互体验，将应用于车载系统、智能眼镜等场景。

9月28日，全球最大AI开源社区Hugging Face公布了最新一期模型榜单，阿里巴巴通义的7款模型包揽了全球前十开源模型榜单，其中最新开源的全模态大模型Qwen3-Omni强势登顶。Qwen3-Omni实现了行业内的首次突破，该模型具备强大的音视频处理能力，在32项开源最佳性能SOTA中名列前茅。它能够处理文本、图片、语音和视频四种不同类型的多模态数据，像人类一样“听、说、写”。尤其值得一提的是，Qwen3-Omni在提升音频与音视频能力的同时，单模态的文本与图像处理性能也保持了高水平，这在行业内尚属首次。

以往需要多个模型协作才能完成的复杂任务，现在只需Qwen3-Omni一个模型就能实现，极大地提升了用户与AI的交互体验。未来，该模型将广泛应用于车载系统、智能眼镜和智能手机等多个场景。

通义大模型家族在各个领域全面开花。在最近举行的2025云栖大会上，阿里巴巴一口气发布了7款新模型。除了Qwen3-Omni外，还包括视觉理解模型Qwen3-VL、图像编辑模型Qwen-Image-Edit-2509、动作生成模型Wan2.2-Animate以及深度研究Agent模型DeepResearch等6款不同规模的模型，全部入选Hugging Face全球开源榜单前十。

截至目前，阿里巴巴通义已经开源了超过300个模型，覆盖了全模态和全尺寸，全球下载量突破6亿次，衍生出的模型超过17万个，稳居全球第一。

(以上内容均由Ai生成)