Google 的图像和视频 AI 模型获得重大升级

发布时间：2025年5月21日来源：szf

快速阅读: 据《WebPro新闻》最新报道，谷歌升级其AI模型，包括Veo可生成有声视频、Flow能创建电影级视频、Lyria与YouTube Shorts集成及Imagen支持多种长宽比。这些更新巩固了谷歌在AI领域的竞争力。

谷歌宣布对其图像和视频AI模型进行重大更新，新增多项功能并修复了一个关键限制。谷歌一直在积极改进自身的AI模型，因为它正与OpenAI、Anthropic、微软等公司展开激烈竞争。谷歌在Gemini项目上取得了显著进展，并且大幅提升了其Imagen图像生成器、Veo视频编辑器、Flow电影制作生成器以及Lyria音乐生成器。

**Veo**
Veo 3的最大升级在于能够生成带有声音的视频。令人感兴趣的是，谷歌依然持续改进Veo 2版本，新增了许多功能，包括基于参考的视频能力、相机控制、扩展绘画（Outpainting）以及从视频中添加或删除对象的能力。

**Flow**
除了将Veo 2中的基于参考的视频和相机控制功能引入Flow之外，这家公司的电影制作生成器还能利用Google DeepMind的不同模块来创建电影级别的视频。

**Lyria**
谷歌对Lyria 2进行了多方面的优化，其中包括与YouTube Shorts的集成。

**Imagen**
Imagen 4的一些功能升级尤为突出，大多数用户都将从中受益。特别是支持不同长宽比创建图像的功能广受欢迎。自从谷歌将图像生成添加到Gemini之后，其功能一直局限于1:1的比例。例如，在一个示例中，Gemini被要求生成一张湖边小屋的图片，并明确指定使用16:9的比例。相比之下，在经过Imagen 4升级后，Gemini使用相同的提示生成了以下图像。

谷歌显然在AI模型领域取得了重要突破，这些最新升级标志着其发展的重要一步。

(以上内容均由Ai生成)