腾讯发布混元Image 2.1，支持2K分辨率及复杂语义生成

发布时间：2025年9月10日来源：szf

快速阅读: 腾讯发布混元图像2.1，支持原生2K分辨率图像生成，具备强大复杂语义理解能力，开放源代码助力视觉创作。

腾讯混元发布了最新的生图模型“混元图像2.1（HunyuanImage2.1）”。这款新的开源文生图模型在多个方面实现了重要升级，支持原生2K分辨率图像生成，旨在为设计师和视觉创作者提供更加高效、便捷的创作工具。

此次更新中，混元图像2.1在性能和生成效果之间达到了更好的平衡。该模型不仅支持中英文原生输入，还能生成高质量的复杂语义文本。这些特点使得创作者能够轻松制作出多样的图像作品，包括精美的插画、创意海报以及各种漫画形式，均能迅速实现。

混元图像2.1的升级得益于其庞大的图文对齐数据集，这使得模型在复杂语义理解和跨领域泛化能力上有了显著提升。它支持最长1000个tokens的提示词，能够准确生成场景细节、人物表情和动作，并允许对多个物体进行独立描述和控制。此外，新模型在处理图像中的文字信息时表现优异，能够自然地将文字与画面结合，增强了作品的整体美感。

作为一款开源模型，混元图像2.1的代码和权重已在Hugging Face和GitHub等平台发布。个人及企业开发者均可基于此基础模型开展进一步研究和开发，以满足不同需求。未来，腾讯透露正在研发一款原生多模态图像生成模型，值得期待。

混元图像2.1的推出将为视觉创作者带来更多样化的创作工具，帮助他们在创意实现的道路上取得更大进展。相关链接：腾讯混元官网：https://hunyuan.tencent.com/image；GitHub：https://github.com/Tencent-Hunyuan/HunyuanImage-2.1；Hugging Face：https://huggingface.co/tencent/HunyuanImage-2.1；Hugging Face Demo：https://huggingface.co/spaces/tencent/HunyuanImage-2.1。关键点：支持原生2K分辨率，提高图像生成质量和效率；具备强大的复杂语义理解能力，支持高质量文本生成；开源模型已上线，供开发者研究与开发。

(以上内容均由Ai生成)