阿里通义Qwen3-Omni登顶Hugging Face,全模态大模型创多项第一
快速阅读: 9月28日,Hugging Face公布最新模型榜单,阿里巴巴通义7款模型上榜,Qwen3-Omni登顶。该模型首度实现音视频与文本图像处理高性能结合,极大提升AI交互体验,将应用于车载系统、智能眼镜等场景。
9月28日,全球最大AI开源社区Hugging Face公布了最新一期模型榜单,阿里巴巴通义的7款模型包揽了全球前十开源模型榜单,其中最新开源的全模态大模型Qwen3-Omni强势登顶。Qwen3-Omni实现了行业内的首次突破,该模型具备强大的音视频处理能力,在32项开源最佳性能SOTA中名列前茅。它能够处理文本、图片、语音和视频四种不同类型的多模态数据,像人类一样“听、说、写”。尤其值得一提的是,Qwen3-Omni在提升音频与音视频能力的同时,单模态的文本与图像处理性能也保持了高水平,这在行业内尚属首次。
以往需要多个模型协作才能完成的复杂任务,现在只需Qwen3-Omni一个模型就能实现,极大地提升了用户与AI的交互体验。未来,该模型将广泛应用于车载系统、智能眼镜和智能手机等多个场景。
通义大模型家族在各个领域全面开花。在最近举行的2025云栖大会上,阿里巴巴一口气发布了7款新模型。除了Qwen3-Omni外,还包括视觉理解模型Qwen3-VL、图像编辑模型Qwen-Image-Edit-2509、动作生成模型Wan2.2-Animate以及深度研究Agent模型DeepResearch等6款不同规模的模型,全部入选Hugging Face全球开源榜单前十。
截至目前,阿里巴巴通义已经开源了超过300个模型,覆盖了全模态和全尺寸,全球下载量突破6亿次,衍生出的模型超过17万个,稳居全球第一。
(以上内容均由Ai生成)