Moonvalley 的 Marey 是一种最先进的 AI 视频模型,使用完全许可的数据进行训练
快速阅读: 据《VentureBeat 公司》最新报道,一家名为Moonvalley的初创公司推出名为Marey的AI视频模型,专注合法授权数据,提供更道德的选择。Marey具备多项创新功能,正逐步开放测试,挑战现有竞争者。
订阅我们的每日和每周简报,获取关于行业领先人工智能报道的最新动态和独家内容。了解更多
几年前,没有“生成式人工智能视频模型”这个概念。如今,这类模型已有数十种,其中许多能够在几秒内生成超高清、超逼真的好莱坞级别视频。如果你最近几个月读过《创业邦》,你无疑已经读到关于这些模型及其背后公司的文章,从Runway的Gen-3到谷歌的Veo 2,再到OpenAI的姗姗来迟但终于可用的Sora,以及Luma AI、Pika,还有中国新秀Kling和Hailuo。甚至连阿里巴巴和一家名为Genmo的初创公司也提供了开源视频模型。这些模型已被用于制作多部大片的部分内容,从《瞬息全宇宙》到HBO的《真探:夜国》,再到Toys R’ Us和Coca Cola的音乐视频和电视广告。
尽管好莱坞和电影制作者相对快速地接受了人工智能,但仍然存在一个潜在的大问题:版权问题。根据我们所知,由于大多数人工智能视频模型初创公司没有公开其训练数据的具体细节,大多数模型都是在大量上传到网络或从其他档案来源收集的视频上进行训练的,其中包括一些版权所有者可能并未明确授权人工智能视频公司使用这些数据进行训练的内容。事实上,Runway是面临集体诉讼的公司之一(仍在法院审理中),据报道Nvidia也为此目的抓取了大量的YouTube视频。关于抓取包括视频在内的数据是否构成公平且具有转化性的使用,争议仍在继续。
但现在有了一个新的替代方案,那些担心版权问题并希望避免使用存在疑问模型的人有了选择。一家名为Moonvalley的初创公司——由前Google DeepMind的研究人员和其他来自Meta、微软和TikTok等公司的研究人员创立——推出了Marey,这是一个专为好莱坞工作室、电影制作者和企业品牌设计的生成式人工智能视频模型。作为一款“清洁”的尖端基础人工智能视频模型,Marey仅在自有和许可的数据上进行训练,提供了一个与使用抓取内容开发的人工智能模型不同的道德选择。
“人们说不使用抓取数据就不可能构建尖端的人工智能视频模型,”Moonvalley首席执行官兼联合创始人纳伊姆·塔卢卡尔德(Naeem Talukdar)在最近一次与《创业邦》的视频通话采访中表示。“我们证明了这是可行的。”
目前,Marey以邀请制的方式开放申请,与Adobe的Firefly Video模型一样,这家老牌软件供应商称其也是企业级的——仅在许可数据和Adobe Stock数据上进行了训练(这让一些贡献者感到不满)——并为企业使用提供赔偿保障。Moonvalley也在本文件第7条中提供赔偿保障,表示将自费为客户辩护。Moonvalley希望通过这些功能使Marey吸引大型工作室——即使像Runway这样的公司也在与它们达成协议——以及电影制作者,成为众多不断涌现的新人工智能视频创作选择之一。
更“道德”的人工智能视频?
Marey是Moonvalley与艺术家主导的AI电影和动画工作室Asteria合作的结果。该模型旨在辅助而非取代创意专业人士,为电影制作者提供新的工具来进行AI驱动的视频制作,同时保持传统行业的标准。
“我们的信念是,除非与行业合作,否则这个行业不会广泛采用这些模型,”Talukdar说。“行业非常明确地表示,为了让他们实际使用这些模型,我们需要弄清楚如何构建一个‘干净’的模型。直到今天,主流观点还是认为这做不到。”
Moonvalley没有从互联网上抓取内容,而是直接与创作者建立关系,以获得他们的素材使用权。该公司花费了几个月时间建立这些合作关系,确保所有用于训练的数据都是合法获取并完全授权的。Moonvalley的授权策略还旨在通过补偿创作者的贡献来支持内容创作者。
“现在我们的大多数关系都是主动找上门来的,因为人们开始听说我们在做什么,”Talukdar说。“对于小城镇的创作者来说,他们很多素材都只是闲置着。我们想帮助他们将其货币化,并且我们希望做专注于艺术家的模型。最终这将形成一种非常良好的合作关系。”
塔卢克达尔在接受《创业邦》采访时提到,尽管公司仍在评估和调整具体的补偿模式,但通常会根据创作者的素材时长向他们支付报酬,按小时或分钟计费,在固定期限许可协议下(例如12个月或4个月)进行支付。这使得如果内容继续被使用,创作者可能获得额外收益。
公司的目标是让高端视频制作更具可及性和成本效益,让电影制作者、工作室和广告商无需担心法律或道德问题,就能探索AI生成的故事叙述。
更多电影级控制——超越文本提示、图像和摄像机方向
塔卢克达尔解释说,Moonvalley在开发Marey AI视频模型时采取了与现有AI视频模型不同的方法,专注于专业级制作而非消费级应用。
“如今大多数生成式视频公司更注重消费者市场,”他说,“它们构建的是简单的模型,你只需向聊天机器人发出提示,生成一些片段并添加酷炫效果。我们的重点不同:好莱坞工作室需要什么样的技术?主要品牌需要制作超级碗广告又需要什么?”
Marey在AI生成的视频方面引入了几项创新,包括:
– **原生高清生成技术**——无需依赖放大技术即可生成高清视频,减少视觉伪影。
– **延长视频长度**——与大多数只能生成几秒视频的AI视频模型不同,Marey可以在单次运行中创建30秒的序列。
– **分层编辑**——与其他生成式视频模型不同,Marey允许用户分别编辑前景、中景和背景,提供对视频构图的更精确控制。
– **分镜脚本与草图输入**——不仅仅是依赖文本提示(许多AI模型都这样做),Marey还允许电影制作者使用分镜脚本、草图甚至实拍参考来创作,使其对专业人士更加直观。
– **对外部输入更加敏感**——该模型设计得能更好地解读外部输入,如绘画和动作参考,使AI生成的视频更具可控性。
– **原生生成型视频编辑器**——Moonvalley正在为Marey开发配套软件,这是一款功能强大的原生生成型视频编辑工具,帮助用户更有效地管理项目和时间线。
“这个模型本身非常注重可控性,”塔卢克达尔解释道,“你需要对输出结果有显著更多的控制——能够改变角色。这是首个支持分层编辑的模型,因此你可以单独编辑前景、中景和背景。这也是首个专为好莱坞打造、专门用于生产的模型。”
此外,他告诉《创业邦》,Marey依赖于一种扩散-Transformer混合架构,结合了扩散和基于Transformer的架构。
“这些模型是扩散-Transformer模型,所以是Transformer架构,并且在层中包含扩散,”塔卢克达尔说。“当你引入可控性时,通常是通过这些层来实现的。”
此外,他告诉《创业邦》,Marey依赖于一种扩散-Transformer混合架构,结合了扩散和基于Transformer的架构。
由知名风投公司支持,但目前资金规模小于其他AI视频初创公司
本周,Moonvalley还宣布了一轮由Bessemer Venture Partners、Khosla Ventures和General Catalyst领投的7000万美元种子轮融资。投资者Hemant Taneja、Samir Kaul和Byron Deeter也加入了公司的董事会。
塔卢克达尔指出,目前Moonvalley的资金远少于一些竞争对手——据报道,Runway在多轮融资中共筹集了2.7亿美元——但该公司通过组建一支精英AI研究人员和工程师团队优化了资源。
“我们筹集了大约7000万美元,比我们的竞争对手少得多,当然,”他说。“但这归根结底在于团队——拥有一支能够显著更高效地构建架构、计算等所有相关工作的团队。”
Marey目前处于有限访问阶段,一些工作室和电影制作者正在测试该模型。Moonvalley计划在未来几周内逐步开放访问权限。
“目前,有多家工作室正在获得对该模型的访问权限,我们有一个由几十位电影制作者组成的Alpha组正在使用它,”塔卢克达尔确认道。“希望它能在几周内全面上线,最晚几个月内。”
通过Marey的发布,Moonvalley和Asteria旨在引领AI辅助电影制作的前沿,为工作室和品牌提供一种集成AI而不妥协创意完整性的解决方案。然而,随着像Runway、Pika和Hedra这样的AI视频初创公司竞争对手继续添加新功能,如角色语音和动作,这一领域变得更具竞争力。
每日商业应用场景洞察——VB每日
如果你想给老板留下好印象,VB Daily 能助你一臂之力。我们将为你揭秘公司应用生成式人工智能的内部动态,从监管调整到实际应用,从而帮助你分享见解,最大化投资回报。立即订阅获取更多。
查看我们的隐私政策
感谢您的订阅
了解更多VB时事通讯
出现错误。
(以上内容均由Ai生成)