Google 的图像和视频 AI 模型获得重大升级
快速阅读: 据《WebPro新闻》最新报道,谷歌升级其AI模型,包括Veo可生成有声视频、Flow能创建电影级视频、Lyria与YouTube Shorts集成及Imagen支持多种长宽比。这些更新巩固了谷歌在AI领域的竞争力。
谷歌宣布对其图像和视频AI模型进行重大更新,新增多项功能并修复了一个关键限制。谷歌一直在积极改进自身的AI模型,因为它正与OpenAI、Anthropic、微软等公司展开激烈竞争。谷歌在Gemini项目上取得了显著进展,并且大幅提升了其Imagen图像生成器、Veo视频编辑器、Flow电影制作生成器以及Lyria音乐生成器。
**Veo**
Veo 3的最大升级在于能够生成带有声音的视频。令人感兴趣的是,谷歌依然持续改进Veo 2版本,新增了许多功能,包括基于参考的视频能力、相机控制、扩展绘画(Outpainting)以及从视频中添加或删除对象的能力。
**Flow**
除了将Veo 2中的基于参考的视频和相机控制功能引入Flow之外,这家公司的电影制作生成器还能利用Google DeepMind的不同模块来创建电影级别的视频。
**Lyria**
谷歌对Lyria 2进行了多方面的优化,其中包括与YouTube Shorts的集成。
**Imagen**
Imagen 4的一些功能升级尤为突出,大多数用户都将从中受益。特别是支持不同长宽比创建图像的功能广受欢迎。自从谷歌将图像生成添加到Gemini之后,其功能一直局限于1:1的比例。例如,在一个示例中,Gemini被要求生成一张湖边小屋的图片,并明确指定使用16:9的比例。相比之下,在经过Imagen 4升级后,Gemini使用相同的提示生成了以下图像。
谷歌显然在AI模型领域取得了重要突破,这些最新升级标志着其发展的重要一步。
(以上内容均由Ai生成)