Google Photos 推出 Veo 2 和 Gemini 的 AI 照片转视频
快速阅读: 《网络新闻》消息,谷歌推出“照片转视频”功能,利用AI将图片生成8秒动态视频,支持添加音效与特效,提升用户创作体验。
据TechRadar报道,7月10日,谷歌在其Google Photos应用中推出了一项名为“照片转视频”的新功能,可以将静态图片转化为动态短视频。这项技术基于谷歌先进的Veo 2人工智能视频模型,能够生成8秒的视频片段,为照片增添逼真的运动效果,甚至加入音效。
用户只需从自己的图库中选择一张照片,提供一个描述性的提示,就能观看AI预测的动作,如挥手或宠物奔跑,同时遵循现实世界的物理规律。这一功能不仅限于表面动画,而是通过机器学习从大量数据中预测合理行为,使照片中的人物仿佛“活”了起来。
除了新颖性外,“照片转视频”还无缝融入谷歌的生态系统,包括YouTube Shorts和Gemini应用程序,支持用户直接在Google Photos中创作视频,并选择添加动漫风格的效果或漫画书特效。News9live报道称,此次更新增加了新的“创作”标签,简化了对这些工具的访问,激发了普通用户和内容创作者的兴趣。
行业内部人士指出,这一功能建立在谷歌之前在Gemini应用程序中对Veo 3的探索基础上,付费订阅者已能将照片转换为带音频的视频。彭博社报道了最初的发布,强调该功能面向Google AI Pro和Ultra订阅者,表明谷歌采用了分层盈利策略,以弥补高级AI处理的计算成本。
然而,技术基础和挑战并存。Veo模型是谷歌对OpenAI的Sora和Meta等竞争对手的回应,专注于从静态图像生成高保真视频。The Verge详细介绍了Veo 3如何驱动8秒的视频片段并配以声音,确保动作和音频同步。不过,AI可能会虚构不合理的元素或继承训练数据中的偏见,这可能影响生成内容的代表性。
此外,隐私问题也值得关注。动画化个人照片需要将数据上传到谷歌服务器进行处理,尽管公司承诺有强大的数据保护措施,但专家们担忧这可能导致深度伪造和虚假信息的传播。Mashable的报道提醒用户注意伦理使用的问题。
对于科技行业而言,这一功能使Google Photos成为AI增强型消费者应用的领先者,有望提升用户参与度和订阅收入。拥有超过十亿用户的Google Photos将使视频创作更加普及,使小型企业和网红无需昂贵设备即可制作内容。《华盛顿邮报》指出,该工具已在安卓和iOS上推出,扩大了其影响力。
早期采用者已开始展示令人惊叹的结果,从动画化家庭肖像到创造类似3D的效果。然而,真正的考验在于广泛采用及谷歌如何根据反馈进行改进,可能扩展视频长度或集成更高级的提示。
展望未来,这一动画功能预示着一个AI模糊摄影和视频界限的未来,将静态记忆转化为沉浸式故事。随着谷歌继续完善Gemini和Veo,我们可能会看到与增强现实或协作编辑的整合,进一步革新数字创造力。尽管这项技术令人眼花缭乱,但在生成媒体时代,它也引发了关于真实性的疑问。行业观察者将密切关注监管机构的反应,确保创新不会超越保障措施。
(以上内容均由Ai生成)