谷歌Veo3上线Gemini API 推动AI视频成本新高
快速阅读: 据相关媒体报道,谷歌宣布旗舰视频模型Veo3通过Gemini API开放,支持文本转视频及同步音频生成,但价格较高。Veo3主要用于专业领域,如动画制作和游戏开发。
据谷歌官方消息,10月12日,谷歌宣布其旗舰级视频生成模型Veo3已通过Gemini API向开发者开放,提供文本转视频及同步音频生成功能。这一举措标志着AI视频制作进入新阶段,同时也带来了较高的成本。
Veo3是谷歌首款能够通过单一文本提示生成高分辨率视频,并同步生成对话、音乐和音效的模型。目前,Gemini API仅支持文本转视频功能,但谷歌表示,图像转视频的支持也即将推出。
此次API集成对希望将高级视频生成功能整合到自身应用或构建可投入生产的原型的开发者来说,是一大助力。Google AI Studio提供了SDK模板和入门应用,帮助开发者快速上手。使用该API需拥有一个已启用计费功能的活跃Google Cloud项目。谷歌透露,Veo3已在Gemini应用、Flow和Vertex AI中被使用数百万次。
然而,Veo3的价格使其成为AI视频生成领域中较为昂贵的选择。通过Gemini API访问Veo3仅在Google Cloud付费套餐中可用。以720p、24fps的视频(含16:9格式音频)为例,每秒定价为0.75美元,比不含音频的Veo2贵25美分。这意味着,一段八秒的视频需要6美元,而一段五分钟的视频则高达225美元。考虑到通常需要多次尝试才能达到理想效果,实际成本可能会迅速增加。例如,如果需要十倍的素材量才能制作出五分钟的可用视频,总成本可能达到2,250美元。尽管如此,谷歌认为在某些特定用例中,这仍然比传统视频制作更具成本效益。谷歌还宣布了“Veo3Fast”模式,该模式速度更快、价格更低,但目前尚未在API中提供。
目前,Veo3的应用主要集中在专业领域。例如,Cartwheel利用Veo3将2D视频转换为逼真的3D角色动画,并将其生成的动作映射到客户项目的装配模型上。游戏工作室Volley也使用Veo3为其角色扮演游戏《Wit’s End》制作过场动画,使开发者能够快速尝试新的故事创意和视觉效果。这些案例表明,谷歌目前更侧重于专业级应用,尽管不排除有其他公司在幕后使用Veo3但尚未公开。
(以上内容均由AI生成)