黑森林实验室发布FLUX.2,最强开源文生图+多图参考工具
快速阅读: Black Forest Labs发布FLUX.2系列四款模型,包括pro、flex、dev和klein,其中dev已开源。核心升级包括十图参考、4MP编辑、高精度文本渲染和现实逻辑优化,显著提升图像生成质量。
Black Forest Labs正式发布了FLUX.2系列,一次性推出pro、flex、dev(已开源)和klein(即将推出)四款模型,并同步开源了32B参数的FLUX.2[dev]权重与代码,声称这是目前最强的开源文生图、多图参考和4MP编辑工具。
核心升级:
– 十图参考:用户可以一次性上传最多10张风格或构图样例,生成图像的一致性超过95%,支持姿势、光影和配色锁定。
– 4MP编辑:通过输入和遮罩即可实现局部重绘、去除水印和更换背景,分辨率提升至4MP,PSD分层导出功能已在开发计划中。
– 文本渲染:复杂排版、信息图和UI界面的文字准确率达到92%,比DALL·E3高出约10个百分点。
– 现实逻辑:空间关系、光照物理和世界知识的错误率降低了37%,生成的表情包和梗图更加可靠。
四款模型特点:
– pro:商业旗舰版本,速度提升2倍,成本下降30%,官方定位为“封闭源模型替代”。
– flex:支持可调步数和引导系数,适合开发者进行二次调优。
– dev:32B参数开源权重,集文生图和多图编辑于一体,采用Apache 2.0授权。
– klein:即将推出的轻量版,性能参数减少50%,面向边缘设备。
开发者友好:
– 新VAE自编码器:潜在空间压缩率提升18%,训练和推理显存节省约15%。
– 示例代码:PyTorch、Diffusers和ComfyUI插件即日上架,GitHub仓库已提供入门脚本。
在线体验:
– 在线Demo:huggingface.co/spaces/BlackForestLabs/FLUX-2-dev,用户可零代码体验。
行业影响:
– Stable Diffusion官方社区率先宣布支持FLUX.2 checkpoint,ComfyUI已发布适配节点。AIbase认为,FLUX.2的多图参考和4MP编辑功能将显著降低电商、广告和漫画行业的视觉制作门槛,开源生态或将迎来“后SD时代”。
(以上内容均由Ai生成)