ElevenLabs推出全能AI内容工厂,一站生成视音频
快速阅读: ElevenLabs推出「Image & Video平台」,集成图像生成、视频制作、声音合成等多功能,实现音画无缝整合,提升AI内容生产效率,支持多平台视频输出及多语言旁白,简化创作者工作流程。
多模态AI领导者ElevenLabs宣布推出全新的「Image & Video平台」,这不仅是一个语音工具,而是融合了图像生成、视频制作、声音合成、音乐创作和音效设计的全能型AI内容工厂。从此,创作者和营销人员无需在多个平台间切换,通过这个平台即可一站式完成从剧本到成品的商业视频制作。
新平台实现了视觉生成与ElevenLabs引以为傲的音频技术的无缝整合:用户可以先创建静态图片和动态视频,然后在同一界面中添加专业的旁白、背景音乐和环境音效,整个过程流畅无阻。官方表示,从创意构思到可用于广告投放的成品视频,最快仅需几分钟,极大提升了AI内容生产的效率。
该平台集成了全球领先的多模态模型,涵盖Google的Veo(超长视频一致性)、OpenAI的Sora(电影级画质)以及Kling(超现实物理效果)等,配合ElevenLabs自主研发的自然语音和最新音乐生成技术,用户能够自由组合顶级视觉和听觉元素,创造出超越单一模型组合的效果。
平台针对创作者和营销人员进行了深度优化,支持输出不同比例的视频,适应抖音、小红书、TikTok、YouTube等平台的需求;内置商业安全的语音和音乐库,生成的内容可以直接用于广告;提供多语言旁白一键替换功能,轻松制作多语种版本;配备完整的时间轴编辑器,支持精确至帧的音画同步调整。
据官方演示,利用平台内的30秒文案,用户可以快速完成品牌故事板的图像生成、转换为流畅视频、添加CEO级别的自然旁白、叠加情绪化的背景音乐和环境音效,最终导出4K商用成品,整个过程无需在Premiere、Midjourney、Runway、Suno等软件之间切换文件。
AIbase编辑部评论称,ElevenLabs此次升级显著提升了“文本到视频”技术的上限,尤其在解决音画同步这一难题上取得了突破。当顶级视觉生成与声音生成技术结合时,独立创作者和小型企业将面临前所未有的挑战。这次更新可能会导致许多剪辑师和配音员的工作受到影响。体验地址:https://elevenlabs.io/image-video
(以上内容均由Ai生成)