腾讯发布并开源首个3D世界模型混元
快速阅读: 据相关媒体最新报道,腾讯发布混元3D世界模型1.0,支持文图生成3D场景,可沉浸交互,全面开源,提升游戏开发与数字内容创作效率。
IT之家 7 月 27 日消息,今天,在 2025 世界人工智能大会腾讯论坛上,腾讯正式发布混元 3D 世界模型 1.0,并全面开源。
据介绍, 这是业界首个开源可沉浸漫游、可交互、可仿真的世界生成模型 ,为游戏开发、VR、数字内容创作等领域带来了全新的可能性。除 3D 世界模型外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。
腾讯混元 3D 世界模型 1.0 融合了全景视觉生成与分层 3D 重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游 3D 场景生成。
过去需要专业建模团队数周才能搭建的 3D 虚拟世界,现在只需一句文字或一张图片,几分钟内即可生成 。
对游戏开发者而言,混元 3D 世界模型极大简化了 3D 场景构建流程,只需输入简单指令,模型即可快速生成包含建筑、地形、植被的完整 3D 场景。输出的 Mesh 文件可用于游戏原型搭建或关卡设计,还能灵活调整前景物体、更换天空背景,满足个性化创作需求。
无建模经验的普通用户,通过混元 3D 创作引擎,仅需一句话或者一张图即可快速生成 360° 沉浸式视觉空间,生成的场景可无缝导入 Vision Pro 等虚拟头显,带来沉浸式体验。
IT之家从官方介绍获悉,混元 3D 世界模型 1.0 的核心还在于其创新的「语意层次化 3D 场景表征及生成算法」。该算法将复杂 3D 世界解构为不同语意层级, 实现前景与背景、地面与天空的智能分离 ,不仅生成视觉效果逼真的整体场景,还能输出标准化的 3D Mesh 资产,兼容 Unity、Unreal Engine、Blender 等主流工具。用户可对场景内元素进行独立编辑或物理仿真,无缝衔接 AIGC 技术与传统 CG 工作流。
与全球领先的开源模型相比,混元 3D 世界模型 1.0 在文生世界、图生世界的美学质量和指令遵循能力等关键维度均 全面超越当前 SOTA 的开源模型 。
腾讯混元 3D 世界模型 1.0: 项目主页: https://3d-models.hunyuan.tencent.com/world/ 体验地址: https://3d.hunyuan.tencent.com/sceneTo3D Hugging Face 模型地址: https://huggingface.co/tencent/HunyuanWorld-1 Github 项目地址: https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0
(以上内容均由AI生成)