谷歌即将推出的 Sparks 功能在 Illuminate 中制作 TikTok 风格的解说视频
快速阅读: 据《Neowin.net》称,谷歌AI项目Illuminate新增功能“Spark”,可生成AI短视频解释器。该功能基于“100% AI生成”技术,可能与Veo 3或Gemini多模态版本有关。此外,NotebookLM也可能集成类似视频概览功能,两者技术或有相通之处。
就在Material 3 Expressive正式亮相一周后,此前一些被戏称“女性化”的早期泄露事件之后,我们首次见证了谷歌现有AI项目Illuminate悄然发展的新功能。Illuminate以其将密集研究论文转化为AI生成音频讨论而闻名,尽管Neowin的测试表明它几乎可以处理任何文章,目前每位用户每天可生成20段音频摘要。
TestingCatalog近期的研究发现,谷歌正在扩展Illuminate的功能。最近的一次更新展示了一个包含AI音频摘要的主页,其中包括对经典书籍《弗兰肯斯坦》和《了不起的盖茨比》的支持。新功能还引入了一些实验性控制选项,比如编辑按钮和封面图片的图像生成功能,但最引人注目的是名为“火花”的部分,这是一个根据用户提示生成短视频解释器的功能。
图片来源:TestingCatalog
查看Spark的描述,“100% AI生成”是关键短语,这表明有一个模型能够根据提示同步生成视频和音频。TestingCatalog指出,垂直视频的样例——大约一到三分钟长——是可以看到的,不过实际的生成工具似乎目前仅限于谷歌内部使用。以下是一个这类视频的例子(播放前请确保调低音量):
你可以在TestingCatalog发布的这条X帖中找到更多样例。这些样例视频的质量引发了人们的猜测,认为可能是谷歌的Veo 3模型或Gemini的强力多模态版本在背后提供支持。
另一个值得关注的点是与NotebookLM的潜在联系。这是一个服务,连同Illuminate和其他服务一起,不禁让人好奇这家公司究竟有多少“实验性”的生成式AI服务。谷歌已经确认计划在NotebookLM中加入一个由两位AI主持人介绍的视频概览功能,这将让用户获取其上传文档的AI生成视频解说。
正如TestingCatalog所指出的,考虑到相似的对话形式,Illuminate的Spark和NotebookLM的视频功能很可能基于相同的技术。
(以上内容均由Ai生成)