阿里Wan 2.2震撼上线 开源视频生成AI挑战Sora

发布时间:2025年7月25日    来源:szf
阿里Wan 2.2震撼上线 开源视频生成AI挑战Sora

快速阅读: 相关媒体消息,阿里巴巴云将发布视频生成AI模型Wan2.2,性能大幅提升,支持高分辨率和长视频生成。新增文本到视频、图像到视频等功能,降低硬件要求,继续开源。

阿里巴巴云宣布其备受期待的视频生成AI模型 Wan2.2 即将在近期正式发布。作为Wan2.1的升级版本,Wan2.2预计在性能、效率和功能上实现重大突破,继续秉承阿里开源AI的战略,巩固其在全球AI视频生成领域的领先地位。继Wan2.1于2025年2月开源并取得广泛成功后,Wan2.2的推出引发了开发者社区和行业的热烈讨论。
Wan2.2:技术升级,性能再突破 Wan2.1凭借其 时空变分自编码器(VAE) 和 扩散变换器(DiT) 架构,已在VBench基准测试中以84.7%的得分超越OpenAI的Sora(84.28%)。据社交媒体讨论,Wan2.2预计进一步优化这些技术,显著提升视频生成速度和质量,尤其是在高分辨率(如1080p)和长视频生成中的表现。
预计新增功能包括: 文本到视频(T2V) :支持更高分辨率(如1080p和4K)以及更长的视频生成,生成时间进一步缩短。
图像到视频(I2V) :提升动态场景的流畅性和真实性,支持更复杂的动作和场景转换。
视频到音频(V2A) :增强从视频内容生成匹配音频的能力,提升多模态创作体验。
多语言与风格扩展 :支持更多语言的文本效果生成,并新增多样化的艺术风格模板,如赛博朋克、写实动画等。
硬件优化 :进一步降低硬件需求,T2V-1.3B模型预计在更低显存(如6GB)设备上运行,扩大用户覆盖范围。
Wan2.2的训练数据预计在Wan2.1(15亿视频、100亿图像)的基础上进一步扩充,优化数据筛选以提升生成内容的多样性和真实性。
Wan2.2将继续采用Apache2.0许可证,通过 Alibaba Cloud ModelScope 和 Hugging Face 免费提供代码和模型权重,支持学术研究和商业应用。Wan2.1已推出T2V-1.3B、T2V-14B、I2V-14B-720P和I2V-14B-480P四种变体,Wan2.2预计将新增更多模型变体,针对不同硬件和场景进一步优化。
开发者对Wan2.2的开源前景充满期待,认为其将进一步挑战OpenAI Sora等封闭模型的市场主导地位,推动AI视频生成技术的民主化。阿里此举不仅降低了技术门槛,也为全球开发者提供了更多创新空间。

(以上内容均由AI生成)

关键词: AiSoraWan2开源震撼

你可能还想读

印尼副部长呼吁谨慎使用AI进行公共沟通

印尼副部长呼吁谨慎使用AI进行公共沟通

快速阅读: 印度尼西亚通信和数字事务部副部长Nezar Patria呼吁公共关系专业人员谨慎、道德地使用AI,强调AI虽具潜力,但需人类监督与伦理责任,确保沟通质量与真实性。 雅加达(ANTARA)- 印度尼西亚通信和数字事务部副部长Nez […]

发布时间:2025年10月23日
名人及AI巨头呼吁停止追求超智能

名人及AI巨头呼吁停止追求超智能

快速阅读: 超过700名科学家、政治人物和名人呼吁暂停开发超人工智能,直至技术安全可控且获公众支持。未来生命研究所发布公开信,强调当前AI发展路径与公众期望、安全性及伦理标准脱节。 超过700名科学家、政治人物和名人,包括哈里王子、理查德· […]

发布时间:2025年10月23日
保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日