谷歌发布Veo 3.1,与OpenAI竞争视频生成领域
快速阅读: 谷歌DeepMind发布Veo 3.1,增强AI电影制作工具Flow功能,新增音频生成及编辑选项,提升视频创作控制与质量,激发超过2.75亿视频创作。
谷歌DeepMind宣布推出其生成视频模型Veo 3.1的最新版本,并扩展了其AI电影制作工具Flow的功能。此次更新引入了音频生成、新的编辑选项以及对视频创作的更大控制权。
“五个月前,我们推出了由Veo驱动的AI电影制作工具Flow,它激发了超过2.75亿个视频的创作灵感。”谷歌DeepMind在声明中表示。
Veo 3.1提供了更好的叙事控制和真实感,在Veo 3模型的基础上,增强了提示遵循性和音视频质量。该模型现已集成到Flow中,并通过Gemini API、Vertex AI和Gemini应用程序提供。
新版本为现有的Flow工具,如从素材到视频、从帧到视频和延展功能,增加了音频支持,使创作者能够制作同步声音的视频。
公司表示,这些功能仍在开发中,将根据用户反馈进一步完善。
通过“从素材到视频”,用户可以使用多个参考图像来控制场景的外观。“从帧到视频”功能可生成两个静态图像之间的平滑过渡,“延展”功能则允许创建基于先前片段的更长连续镜头。
Flow还新增了编辑工具。“插入”功能使用户能够在场景中添加新元素,如角色或物体,即将推出的“移除”功能将允许无缝删除不需要的对象。“Flow现在能够处理复杂的细节,如阴影和场景照明,使得添加和移除看起来自然。”公司表示。
Veo 3.1的发布紧随OpenAI最近发布的Sora 2及其同名社交iOS应用程序之后,后者允许用户创建、混编并插入自己到生成的视频中。
(以上内容均由Ai生成)