李飞飞World Labs推Marble 3D公测,文本图片秒变虚拟宇宙
快速阅读: World Labs推出Marble3D世界模型公测版,支持多模态输入即时生成3D虚拟世界,具备灵活编辑与多格式导出功能,助力游戏开发与虚拟现实项目。
知名AI专家李飞飞创立的World Labs近日正式发布了其首款商业产品——Marble3D世界模型公测版。这款创新工具能够从文本提示、单张图像、多张图片、视频或粗略3D布局直接生成完整且可导航的3D虚拟世界。用户不仅可以实时交互编辑,还能轻松导出高斯溅射、三角网格或视频格式。
经过两个月的有限Beta测试,此次公测标志着World Labs从实验室概念转变为实用工具。这家估值超过12.5亿美元的初创公司,正通过“大型世界模型”重新定义AI生成内容的边界。
Marble的核心突破在于多模态输入,一键构建沉浸式3D世界。用户只需输入简单的描述或上传媒体,即可生成大规模、风格多样的3D环境。生成过程通常只需10分钟,输出结果几何结构清晰、一致性高,支持实时探索(如鼠标导航浏览)。其主要特点包括:
– 灵活输入与即时生成:从单一文本提示(如“未来城市街景”)或图像扩展至完整世界;多图融合可以合并环境,视频输入则捕捉动态元素,确保输出持久且可导航。
– 交互式编辑与扩展:内置Chisel实验性3D编辑器,用户可以先粗略勾勒空间布局(如墙壁、房间或地形),再用文本提示注入视觉风格。这种“结构分离风格”的设计类似于HTML与CSS的组合,避免了纯文本编辑的局限性。支持一键扩展现有世界,或无缝组合多个场景,构建大型虚拟空间。
– 多格式导出,跨平台应用:生成后可直接下载高斯溅射(用于高效渲染)、三角网格(适用于建模软件)或增强视频(添加细节、运动并清理边缘)。这让Marble成为游戏开发、视觉特效(VFX)和虚拟现实(VR)项目的理想选择。
World Labs强调,Marble不仅是一次性生成,而是一个“持久性”世界模型,能够模拟物理真实性,减少生成过程中的变形和不一致问题。公测版已集成Marble Labs工作区,提供案例研究和文档,帮助创作者探索工作流程。
行业影响方面,3D路径与视频路径谁将主导AI内容生成?此次公测让World Labs在“世界模型”赛道上脱颖而出,与谷歌DeepMind的Genie(仍处于研究预览阶段)以及新兴初创公司如Decart、Odyssey形成直接竞争。
专家指出,Marble的3D焦点填补了当前AI多局限于2D文本/图像的空白,推动了从“阅读写作”向“感知构建”的转变。潜在应用包括机器人训练模拟(生成真实环境数据)和影视制作(快速原型化场景)。有趣的是,这一工具可能重塑视频数据生成生态系统。用户可以利用Marble从3D世界导出高质量视频序列,结合AI增强(如添加运动轨迹),高效制造训练数据集。这比纯视频路径(如Sora式生成)具有更高的空间深度,适用于需要物理一致性的场景。
未来,随着模型的迭代,3D路径可能占据优势——但视频路径的即时性仍具有一定的优势。World Labs联合创始人表示,这是“空间智能”的第一步,下一代模型将赋予人类与AI代理共同互动虚拟世界的能力。
总之,Marble的公测不仅激发了AI生成3D的热情,也为开发者开启了无限的创意之门。免费版提供基本生成功能,付费计划(标准版每月20美元起)解锁更多配额和商业权限。
体验地址:https://marble.worldlabs.ai/worlds
(以上内容均由Ai生成)