腾讯开源HunyuanWorld-Voyager，单图生成3D世界登顶全球

发布时间：2025年9月2日来源：szf

快速阅读: 腾讯Hunyuan开源HunyuanWorld-Voyager，具备原生3D重建能力，相机控制优秀，支持实时生成深度信息和RGB视频，广泛应用于游戏开发、VR和3D重建等领域。

腾讯AI研究团队Hunyuan近期动作不断，其最新开源项目HunyuanWorld-Voyager引起了全球AI与3D技术领域的广泛关注。作为一款具备原生3D重建能力的超长程世界模型，HunyuanWorld-Voyager在WorldScore排行榜上位居榜首，凭借卓越的相机控制、内容对齐和3D一致性表现，超越了Gen-3等竞争对手。这款模型为3D重建、深度估计及图像生成3D等应用场景带来了革命性突破。

HunyuanWorld-Voyager的最大亮点在于其原生3D重建能力。只需一张输入图像，模型即可生成与实际世界一致的3D点云，简化了传统3D建模的复杂前处理步骤。依托腾讯在多模态生成领域的深厚积累，该模型能高效捕捉图像中的几何信息和语义细节，为虚拟场景的快速构建提供了可能。这一特性使其在游戏开发、虚拟现实（VR）和数字内容创作等领域展现出广阔的应用前景。

在相机控制方面，HunyuanWorld-Voyager表现优异。用户可以自定义相机路径，模型能够根据轨迹生成几何一致的3D场景，保持长期的空间连贯性。无论是在360°全景漫游还是特定视角的细节探索中，该模型均能提供流畅的交互体验。此外，模型支持实时生成精确对齐的深度信息和RGB视频，无需额外后处理即可用于高质量3D重建，显著提升了开发效率。

根据最新数据，HunyuanWorld-Voyager在WorldScore排行榜上位列第一，在相机控制、内容对齐和3D一致性等关键指标上全面领先于Gen-3等现有模型。其独特的多阶段架构结合了全景图像生成、语义分层和层次化3D重建技术，确保了生成世界的视觉质量和几何一致性。腾讯通过开源完整代码、模型权重和文档，进一步降低了开发者使用门槛，助力全球AI社区的协作创新。

HunyuanWorld-Voyager的应用场景十分广泛。在游戏开发中，开发者可以利用其快速生成可交互的3D世界，大幅缩短开发周期；在VR领域，模型支持生成沉浸式全景环境，为用户提供逼真的虚拟体验；此外，其在3D重建和深度估计方面的出色表现，也可应用于机器人导航、自动驾驶和增强现实（AR）等前沿领域。腾讯表示，该模型的开源将推动3D内容创作的普及，为中小型开发者和独立创作者提供与顶级工作室相匹敌的工具。

腾讯Hunyuan团队此次开源HunyuanWorld-Voyager，是其2025年开源计划的重要组成部分。在此之前，腾讯已经陆续开源了Hunyuan3D-2.0、Hunyuan3D-2.1等多款3D生成模型，涵盖了从高分辨率资产生成到游戏场景优化的多种技术。HunyuanWorld-Voyager的发布进一步巩固了腾讯在全球AI竞赛中的领先地位，其开放的社区驱动模式也与Stable Diffusion等项目形成呼应，对抗西方封闭生态的垄断趋势。

腾讯HunyuanWorld-Voyager的开源标志着3D世界生成技术的又一重大进展。其原生3D重建、卓越的相机控制和广泛的应用场景，不仅为开发者提供了强大的工具，也为AI驱动的虚拟世界探索开启了新的可能性。

项目地址：https://3d-models.hunyuan.tencent.com/world/

(以上内容均由Ai生成)