阿里万相2.6发布,支持角色扮演与15秒视频生成
快速阅读: 据阿里巴巴消息,12月16日,阿里发布万相2.6视频生成模型,支持角色扮演、音画同步与多镜头叙事,单次可生成15秒视频,为国内最高水平,显著降低影视级创作门槛,即日起公众可免费体验。
12月16日,阿里巴巴正式发布新一代万相2.6系列模型。该模型聚焦专业影视制作与图像创作场景,被称作“全球功能最全的视频生成模型”,目前已同步上线阿里云百炼平台及万相官网。
万相2.6是国内首个支持“角色扮演”功能的视频生成模型,具备音画同步、多镜头生成和声音驱动等能力。其单次生成视频时长可达15秒,为国内最高水平。目前,模型家族已覆盖文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成等十余种视觉创作功能。
在角色扮演方面,万相2.6可根据输入视频中的角色外观与音色,按提示词生成单人、多人或人与物合拍的视频。通过多模态联合建模,模型能提取主体的情绪、姿态、视觉特征以及音色、语速等声学信息,实现全感官一致性迁移。此外,新增的专业级分镜控制功能可将简单提示词转化为多镜头脚本,生成具备完整故事线与叙事张力的连贯短片,并在镜头切换中保持主体、场景与氛围的高度统一。
该模型显著降低了影视级创作门槛。普通用户只需上传一段个人视频并输入风格提示词,几分钟内即可获得镜头叙事完整、运镜电影级的短片。广告设计、短剧制作等专业场景也可借助连续提示词生成完整的叙事内容。
今年9月,阿里曾率先在国内推出音画同步的万相2.5模型,其图生视频能力在权威评测集LMArena中位居国内第一。此次2.6版本进一步巩固了其在国内视频生成领域的领先地位。即日起,公众可在万相官网免费体验,企业用户可通过阿里云百炼调用API。千问APP也将在近期上线该模型,提供更丰富的创作玩法。
(以上内容均由Ai生成)
引用自:AIbase人工智能资讯平台