DeepMind 首席执行官 Demis Hassabis 表示,谷歌最终将结合其 Gemini 和 Veo AI 模型
快速阅读: 《雅虎美国》消息,DeepMind CEO哈萨比斯透露,谷歌计划整合Gemini和Veo AI模型,以增强Gemini对物理世界的认知。Gemini可处理多种媒体,Veo的视频数据主要来自YouTube。谷歌正朝全能型AI助手方向发展。
在近期一次做客播客《可能性》中,该播客由领英联合创始人雷德·霍夫曼共同主持,谷歌旗下DeepMind首席执行官德米斯·哈萨比斯表示,谷歌计划最终将Gemini人工智能模型与Veo视频生成模型融合,以提升Gemini对物理世界的理解能力。“我们从一开始就在构建Gemini,我们的基础模型时,就赋予了它全能型的能力,”哈萨比斯说道,“我们这样做的原因在于,我们有一个愿景,即打造一个通用的数字助手,一个……实际上能在现实世界中帮助你的助手。”
如果要用一个词来形容,人工智能行业正在逐步走向全能型模型——这些模型能够理解和生成多种媒体形式。谷歌最新推出的Gemini模型不仅能够生成音频,还能生成图像和文本;而OpenAI的ChatGPT默认模型也可以直接生成图像——当然,包括类似吉卜力动画风格的作品。亚马逊也宣布计划在今年晚些时候推出一款“任意到任意”的模型。
这些全能型模型需要海量的训练数据——包括图像、视频、音频和文本等。哈萨比斯暗示,Veo的视频数据主要来源于YouTube,这是谷歌旗下的平台。“基本上,通过观看大量的YouTube视频,[Veo 2]能够理解世界的物理原理,”哈萨比斯说道。谷歌此前曾告知TechCrunch,其模型可能根据与YouTube创作者的协议,使用部分YouTube内容进行训练。据媒体报道,谷歌去年调整了其服务条款,部分目的就是为了允许公司利用更多数据来训练其人工智能模型。
本文最初发布于TechCrunch,网址为:https://techcrunch.com/2025/04/10/deepmind-ceo-demis-hassabis-says-google-will-eventually-combine-its-gemini-and-veo-ai-models/
(以上内容均由Ai生成)