谷歌的新 AI 电影制作工具融合了 Veo、Imagen 和 Gemini

发布时间：2025年5月21日来源：szf

快速阅读: 据《安卓警察》称，谷歌推出多模态AI工具“Flow”，整合Gemini、Veo和Imagen，助力电影叙事。支持文本转视频、场景修剪和多模态提示，面向Google AI Pro/Ultra用户开放，提供高质量电影级输出，暂未扩展至低阶订阅。

**概要**
谷歌推出面向电影制作的多模态AI工具“Flow”，并在I/O 2025大会展示了其应用。“Flow”结合了Gemini、Veo和Imagen，用于创建视频并增强叙事能力。它为故事专业人士提供了电影剪辑、场景修剪及多模态提示支持等功能，还支持场景扩展等其他功能。谷歌通过颠覆性的方式重新定义了未来几个月内人工智能和生成模型的预期。

在其最新开发者大会I/O 2025上，谷歌不仅介绍了Gemini在搜索业务中的AI模式、Chrome支持及其他领域的创新应用，还推出了“Flow”——一款依托Veo 3和其他模型的强大视频创作套件，帮助用户制作影片故事。

**相关文章**
关于谷歌下一代多模态人工智能Gemini的一切
谷歌Gemini到来，带来了全新的多模态人工智能方法

**文章**
如果你觉得谷歌为其AI工具命名越来越复杂，我们完全可以理解。尽管Gemini是数十亿潜在用户日常应用的核心，但公司也在专门针对创意专业人士开发模型。Imagen是一款专注于图像生成的工具，而Veo则能将同样的文本输入转化为视频。

谷歌Veo 2生成的视频没有音频，但在I/O开发者大会期间，该公司发布了Veo 3，它能够同步处理音视频。

新推出的Flow模型以大多数创作者在最佳状态下专注时的状态命名。本质上，它是Gemini、Veo和Imagen的整合产物，是VideoFX的继承者。谷歌毫不掩饰地表示，这只是Flow的早期阶段，但该模型已经能够将文本提示转换为图像，然后利用这些图像制作短片，修剪场景，并通过重复操作添加后续场景或前置场景。

**为电影叙事全面准备**
用你的语言编织魔法

摄影师可以使用Flow来命名镜头，为每个剪辑指定额外细节，甚至可以指定虚拟摄像机在整个拍摄中的移动方式。谷歌表示，输出结果将遵循提示并提供“出色的电影级输出，物理效果和真实感非常出色”。如果你担心图像生成问题，Flow还允许将生成的艺术作品与你自己独立创建的图像或其他资产融合。

我最喜欢的功能之一类似于谷歌旗下的照片编辑应用Snapseed，可以扩展超出拍摄范围的框架。同样，Flow允许修剪或拉伸任何生成的片段，Flow会为它生成新的结尾；如果有明确的故事发展方向，还支持多模态提示支持。

目前，Flow已在美国向Google AI Pro和Ultra订阅用户开放，并计划支持更多国家。鉴于AI视频处理的资源密集型特性，我们认为短期内这一模型不会出现在价格更低的订阅级别中。这一点从Pro用户每月100次生成限制以及Ultra用户获得Veo 3支持（集成音频生成以提升真实性）中得到再次确认。

(以上内容均由Ai生成)