Google Photos 推出 Veo 2 和 Gemini 的 AI 照片转视频

发布时间：2025年7月25日来源：szf

快速阅读: 《网络新闻》消息，谷歌推出“照片转视频”功能，利用AI将图片生成8秒动态视频，支持添加音效与特效，提升用户创作体验。

据TechRadar报道，7月10日，谷歌在其Google Photos应用中推出了一项名为“照片转视频”的新功能，可以将静态图片转化为动态短视频。这项技术基于谷歌先进的Veo 2人工智能视频模型，能够生成8秒的视频片段，为照片增添逼真的运动效果，甚至加入音效。

用户只需从自己的图库中选择一张照片，提供一个描述性的提示，就能观看AI预测的动作，如挥手或宠物奔跑，同时遵循现实世界的物理规律。这一功能不仅限于表面动画，而是通过机器学习从大量数据中预测合理行为，使照片中的人物仿佛“活”了起来。

除了新颖性外，“照片转视频”还无缝融入谷歌的生态系统，包括YouTube Shorts和Gemini应用程序，支持用户直接在Google Photos中创作视频，并选择添加动漫风格的效果或漫画书特效。News9live报道称，此次更新增加了新的“创作”标签，简化了对这些工具的访问，激发了普通用户和内容创作者的兴趣。

行业内部人士指出，这一功能建立在谷歌之前在Gemini应用程序中对Veo 3的探索基础上，付费订阅者已能将照片转换为带音频的视频。彭博社报道了最初的发布，强调该功能面向Google AI Pro和Ultra订阅者，表明谷歌采用了分层盈利策略，以弥补高级AI处理的计算成本。

然而，技术基础和挑战并存。Veo模型是谷歌对OpenAI的Sora和Meta等竞争对手的回应，专注于从静态图像生成高保真视频。The Verge详细介绍了Veo 3如何驱动8秒的视频片段并配以声音，确保动作和音频同步。不过，AI可能会虚构不合理的元素或继承训练数据中的偏见，这可能影响生成内容的代表性。

此外，隐私问题也值得关注。动画化个人照片需要将数据上传到谷歌服务器进行处理，尽管公司承诺有强大的数据保护措施，但专家们担忧这可能导致深度伪造和虚假信息的传播。Mashable的报道提醒用户注意伦理使用的问题。

对于科技行业而言，这一功能使Google Photos成为AI增强型消费者应用的领先者，有望提升用户参与度和订阅收入。拥有超过十亿用户的Google Photos将使视频创作更加普及，使小型企业和网红无需昂贵设备即可制作内容。《华盛顿邮报》指出，该工具已在安卓和iOS上推出，扩大了其影响力。

早期采用者已开始展示令人惊叹的结果，从动画化家庭肖像到创造类似3D的效果。然而，真正的考验在于广泛采用及谷歌如何根据反馈进行改进，可能扩展视频长度或集成更高级的提示。

展望未来，这一动画功能预示着一个AI模糊摄影和视频界限的未来，将静态记忆转化为沉浸式故事。随着谷歌继续完善Gemini和Veo，我们可能会看到与增强现实或协作编辑的整合，进一步革新数字创造力。尽管这项技术令人眼花缭乱，但在生成媒体时代，它也引发了关于真实性的疑问。行业观察者将密切关注监管机构的反应，确保创新不会超越保障措施。

(以上内容均由Ai生成)