腾讯发布并开源3D世界模型混元

发布时间：2025年7月27日来源：szf

快速阅读: 据相关媒体最新报道，2025世界人工智能大会，腾讯发布混元3D世界模型1.0并全面开源，支持沉浸漫游与交互，提升3D场景生成效率，助力游戏、VR等领域发展。

7月27日，2025世界人工智能大会腾讯论坛上，腾讯公司正式发布混元3D世界模型1.0版本，并宣布全面开源。这是业界首个支持沉浸漫游、交互与仿真的开源世界生成模型，为游戏开发、虚拟现实(VR)及数字内容创作等领域带来了新的可能。

混元3D世界模型1.0结合了全景视觉生成与分层3D重建技术，能够通过文字和图片输入，快速生成高质量、风格多样的可漫游3D场景。这项技术大幅简化了3D场景的构建流程，过去需要专业建模团队几周才能完成的任务，现在只需几分钟即可实现。对于游戏开发者来说，该模型可以迅速生成包含建筑、地形、植被等元素的完整3D场景，输出的Mesh文件可以直接用于游戏原型搭建或关卡设计，同时支持前景物体调整和天空背景更换，满足个性化创作需求。即使是没有任何建模经验的普通用户，也能通过混元3D创作引擎轻松生成360°沉浸式视觉空间，并无缝导入Vision Pro等虚拟头显设备，享受沉浸式体验。

混元3D世界模型1.0的核心优势在于其创新的“语意层次化3D场景表征及生成算法”。该算法将复杂的3D世界分解为不同的语意层级，实现前景与背景、地面与天空的智能分离，不仅生成逼真的整体场景，还能输出标准化的3D Mesh资产，兼容Unity、Unreal Engine、Blender等主流工具，便于用户对场景内的元素进行独立编辑或物理仿真，实现了AIGC技术与传统CG工作流的无缝对接。与全球领先的开源模型相比，混元3D世界模型1.0在文生世界、图生世界的美学质量和指令遵循能力等方面均实现了全面超越。

此外，腾讯混元还公布了多项开源计划，包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等。其中，混元旗舰模型TurboS自年初发布以来，每月更新一次，持续在代码生成、理科能力和复杂指令遵循方面取得显著进展，稳居全球大模型权威排行榜前列。基于TurboS基座开发的混元T1进一步提升了推理能力，表现出国内领先的综合水平。同时，端到端语音模型混元Voice、多模态理解模型混元Vision等也基于混元大语言模型基座打造，继承了出色的理解、认知和推理能力，在多模态理解领域多次获奖。

腾讯混元在多模态生成方面布局广泛，3D生成能力全球领先。最新发布的混元3D2.5模型质感显著提升，在上海人工智能实验室的评测中排名全球第一。除混元3D世界模型1.0外，腾讯还将在月底开源一系列小尺寸模型，包括0.5B、1.8B、4B、7B混合推理模型，更加轻量且易于部署。同时，多模态理解模型混元-large-vision和专为游戏场景优化的交互式游戏视频生成框架混元GameCraft等也将于近期对外开源。

腾讯混元还开放了完整的多模态生成能力及工具集插件，陆续开源了业界领先的文生图、视频生成和3D生成能力，提供了接近商业模型性能的开源基座，方便社区根据业务和使用场景进行定制。目前，混元3D系列模型的社区下载量已超过230万次，成为全球最受欢迎的3D开源模型之一。

(以上内容均由AI生成)