新的 Google AI 泄漏揭示了强大的 Gemini 视频升级
快速阅读: 《福布斯》消息,谷歌正在为其Gemini应用测试新的AI视频生成功能,允许用户根据文本提示生成逼真视频片段。目前,这项功能在Freepik平台上以Veo二的形式提供,前一万名用户可免费试用两次,之后需付费。预计未来Gemini高级订阅用户将能持续访问此功能。
谷歌正在为其Gemini应用测试新的AI视频生成功能。这意味着Gemini应用程序可能很快不仅能生成图片,还能根据简单的文本提示生成逼真的视频片段。2月22日更新:谷歌Veo二现已广泛提供给任何人尝试从文本描述创建AI视频。本文最初发布于2月20日。据知名爆料者组装调试在安卓权威网站发现,最新版谷歌应用程序中包含由“罗宾”(公司内部为Gemini功能的代号)支持的新视频生成功能的隐藏提及。代码中还包括与视频生成过程相关的文本片段,如“正在工作……”并会在完成后通知您。谷歌尚未向Gemini用户开放任何AI视频生成工具。然而,这些新的代码片段指向谷歌正在测试可能在未来版本的应用程序中加入的功能。我们尚不清楚这些视频生成工具能做什么,但基于谷歌当前的技术,有几个可能性。最令人期待(或担忧)的可能性是,谷歌将向Gemini用户提供访问Veo二——谷歌深度思维的尖端文本转视频和图像转视频AI模型。Veo二目前以VideoFX的形式通过谷歌实验室提供早期访问,可以根据用户的文本描述或上传的静态图像生成极其逼真的视频片段(如上例所示)。Gemini已经可以使用Imagen三(谷歌的文字转图像模型)从文字提示生成高质量的静态图像。然而,将Gemini的能力扩展到包括Veo二将是一个巨大的进步。与静态图像不同,高质量的AI视频目前需要大量的计算能力来生成,并且通常仅限于付费服务,尽管开源替代品也在不断进步。另一个可能性是,谷歌可能会部署一个大幅缩减版本的Veo二,或者可能是完全不同形式的AI驱动视频生成,例如Gemini驱动的视频创作应用谷歌Vids,目前作为谷歌面向企业的谷歌Vids谷歌工作空间谷歌Vids订阅的一部分提供。谷歌Vids帮助用户制作和协作商业用途的视频,如演示文稿和促销内容,使用模板、库存媒体、AI辅助脚本编写和语音合成。尽管其中某些工具对普通消费者也适用,但在当前形式下,谷歌Vids似乎并不适合Gemini应用。费用是多少?谷歌尚未宣布为Gemini应用提供的任何AI视频生成工具。如果它们出现,我预计谷歌最强大的AI模型将仅限于付费订阅用户。2月20日更新:谷歌Veo二现已在Freepik公开可用。出乎意料的是,AI驱动的创意平台Freepik已将Veo二AI视频模型作为其一站式创意套件的一部分向公众开放。该公司为前一万名用户提供两次免费生成机会,但之后您必须付费,且请注意——这可能会非常昂贵。Freepik在最近的一条推文中宣布了与谷歌的意外合作。推文中包含了一些使用尖端AI模型生成的令人印象深刻的视频片段。目前,该服务只能提供从文本提示创建的Veo二视频,但公司暗示未来将提供图像转视频功能。每个五秒的Veo二视频需要消耗一千个积分。鉴于Freepik上的Veo二价格不菲,我预计谷歌将要求Gemini高级订阅才能持续访问Veo二。关注@paul_monckton在Instagram上。
(以上内容均由Ai生成)