阿里通义开源新ControlNet模型,6亿参数引领图像生成潮流

发布时间:2025年12月3日    来源:szf
阿里通义开源新ControlNet模型,6亿参数引领图像生成潮流

快速阅读: 阿里巴巴通义实验室开源Z-Image-Turbo-Fun-Controlnet-Union模型,扩展Z-Image系列图像生成能力,支持多条件控制融合、高效兼容性及4-bit量化,适用于电商、影视等领域,降低AI图像生成门槛,增强创作效率。

阿里巴巴通义实验室今日正式开源了 Z-Image-Turbo-Fun-Controlnet-Union,这一全新 ControlNet 模型标志着 Z-Image 系列图像生成生态的重大扩展。作为 AIbase 独家追踪的开源 AI 动态,此次发布进一步巩固了 Z-Image-Turbo 在精确控制与创意生成方面的领先地位,迅速引起全球开发者和创作者的广泛关注。

该模型已在 Hugging Face 平台上架,采用 Apache 2.0 许可,适用于商业用途。Z-Image 系列自11月底首次发布以来,迅速登顶 Hugging Face 趋势榜,首日下载量超过50万次。该系列以单流扩散架构为核心,尽管只有6亿参数,却实现了照片级别的真实感渲染,包括皮肤纹理、发丝细节以及光影美学优化。Z-Image-Turbo 作为快速推理版本,仅需8步采样即可生成1024×1024分辨率的图像,推理时间低至9秒(RTX4080硬件),并且支持中英混合文本渲染,显著提高了创作效率。

此次推出的 Z-Image-Turbo-Fun-Controlnet-Union 是对 Z-Image-Turbo 的深度扩展。它在模型的6个核心模块上集成了 ControlNet 结构,兼容 Canny 边缘检测、HED 边界提取及 Depth 深度映射等多种控制条件。该模型专门针对复杂场景设计,例如人物姿态的精确生成和基于线稿的建筑设计,目前通过 Python 代码实现集成,ComfyUI 等工作流的支持也即将跟进。

其核心功能和应用亮点包括:

– **多条件控制融合**:支持姿态、边缘与深度信息的联合输入,实现“零失真”图像操控。开发者可以轻松构建从草图到成品的自动化流程,适用于电商视觉设计、影视特效及游戏原型制作。

– **高效兼容性**:继承了 Z-Image-Turbo 的轻量架构,仅需6GB VRAM 即可运行,远低于传统 ControlNet 模型的硬件要求。测试显示,在低端 GPU 上生成速度可达250秒/5步,平衡了质量和实时性。

– **开源生态赋能**:提供了4-bit 量化版本(如 MFLUX 兼容),便于在 Mac 等消费级设备上部署。同时,Z-Image-Edit 变体增强了复合编辑指令的理解,保持画面的一致性。

这些功能不仅降低了 AI 图像生成的门槛,还为非专业用户打开了专业级创作的大门。社区反馈表明,该模型在广告素材生成中的提示词忠实度超过了 OVIS Image 等竞争对手。

开源社区对 Z-Image-Turbo-Fun-Controlnet-Union 的反应非常热烈,Reddit 和 X 平台上出现了大量基准测试,包括名人面部识别和 K-pop 偶像生成实验,结果显示其在辨识度和自然度方面表现优异。开发者称赞其“按着 Flux 打”的效率优势,特别是在低 CFG Scale (2-3) 下的稳定输出。

AIbase 分析认为,此次发布加强了阿里巴巴在全球开源 AI 领域的竞争力。未来,预计该模型将与 Z-Image-Base 版本联动,形成完整的图像生成-编辑-控制闭环。更多信息请访问 Hugging Face 页面。

(以上内容均由Ai生成)

你可能还想读

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

英伟达4B小模型登顶ARC评测,成本仅GPT-5 Pro的136

快速阅读: 12月8日消息,英伟达推出4B参数小模型NVARC,在ARC-AGI2评测中以27.64%准确率超越GPT-5Pro,单任务推理成本仅0.2美元,凭借零预训练策略和合成数据实现高效低成本部署。 近日,英伟达研发的4B参数小模型N […]

发布时间:2025年12月8日
Meta收购Limitless加码AI可穿戴设备

Meta收购Limitless加码AI可穿戴设备

快速阅读: 据最新消息,Meta收购AI可穿戴设备公司Limitless,后者以无屏幕智能吊坠著称,具备语音交互与实时转录功能;收购后团队并入Meta,专注AI硬件研发,现有产品将停售但提供一年技术支持。 日前,美国科技企业Meta宣布收购 […]

发布时间:2025年12月8日
沐曦股份科创板申购中签率公布

沐曦股份科创板申购中签率公布

快速阅读: 12月8日消息,沐曦集成电路科创板IPO网上申购户数达517.52万户,启动回拨后最终中签率升至0.03348913%,拟募资39.04亿元用于高性能GPU研发及产业化。 12月8日,国产GPU企业沐曦集成电路(上海)股份有限公 […]

发布时间:2025年12月8日
阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

阿里推Qwen3-TTS:49音色10语9方言,WER碾压商用模型

快速阅读: 12月8日消息,阿里巴巴推出通义千问Qwen3-TTS语音合成模型,支持49种音色、10种语言及9种方言,免费开放每月百万字符额度,并在上海120所中小学试点教育应用。 今日,阿里巴巴正式推出通义千问Qwen3系列新成员——Qw […]

发布时间:2025年12月8日
京东云JoyBuilder千卡训练提速3.5倍

京东云JoyBuilder千卡训练提速3.5倍

快速阅读: 12月8日消息,京东云JoyBuilder平台完成关键升级,支持GR00T N1.5千卡训练,兼容LeRobot框架,训练效率提升3.5倍,亿级数据训练从15小时缩短至22分钟。 日前,京东云JoyBuilder模型开发平台完成 […]

发布时间:2025年12月8日
麦肯锡:AI将取代8亿岗位,同时创造新机遇

麦肯锡:AI将取代8亿岗位,同时创造新机遇

快速阅读: 据麦肯锡全球研究院消息,到2030年全球或有8亿岗位被人工智能取代,同时创造1.3亿至2.3亿新岗位,冲击驾驶、物流、医疗、法律等多个行业,专家呼吁加强再培训与政策应对。 日前,人工智能技术快速发展引发全球关注。加州大学伯克利分 […]

发布时间:2025年12月8日
可灵AI上线主体库,角色跨场景“永不变脸”

可灵AI上线主体库,角色跨场景“永不变脸”

快速阅读: 12月8日消息,快手旗下可灵AI发布“主体库”,为O1视频模型新增长期记忆能力,用户上传单图即可跨场景调用一致角色,主体一致性超96%,并推分级服务与2025年多人功能规划。 今日,快手旗下可灵AI正式发布“主体库”(Subje […]

发布时间:2025年12月8日
n1n.ai 重塑大模型API成本与体验

n1n.ai 重塑大模型API成本与体验

快速阅读: 据最新消息,大模型API平台n1n.ai整合近500种开源与闭源模型,价格低至官方十分之一,响应快、稳定性高,已助企业降本超70%并提升用户满意度。 近日,大模型API服务平台n1n.ai凭借高性价比、高稳定性及丰富模型选择,正 […]

发布时间:2025年12月8日