美团开源6B图像模型,中文生成达SOTA水平
快速阅读: 据最新消息,美团LongCat团队开源发布60亿参数的LongCat-Image图像生成模型,在文生图、中文文字渲染及图像编辑方面表现突出,支持海报设计等专业场景,用户可通过Hugging Face和GitHub获取。
近日,美团LongCat团队正式开源发布LongCat-Image图像生成模型。该模型参数规模达60亿,在文生图与图像编辑任务中表现突出,旨在满足当前快速增长的AI图像生成需求,并弥合开源与闭源模型之间的技术差距。
该模型在多项基准测试中达到开源领域最先进水平,尤其在指令遵循与视觉一致性方面展现出强大能力。团队通过系统性训练策略与数据工程优化,确保其在多样化指令下仍保持高效准确的输出。其中,中文文字生成能力尤为亮眼,依托课程学习策略,模型显著提升了对复杂汉字笔画结构的渲染精度,可有效支撑海报设计、商业广告等专业应用场景。
此外,LongCat-Image采用主观评分机制进行评估,确保生成图像在真实度与视觉合理性方面均达到较高水准。凭借综合性能优势,该模型在与国内外主流开源及闭源模型的对比中脱颖而出,具备良好的应用前景。
LongCat团队表示,此次开源旨在构建透明、开放、协作的技术生态,鼓励开发者广泛参与模型使用与共建。目前,用户可通过Hugging Face和GitHub平台获取该模型。与此同时,配套的LongCat APP同步升级,新增图生图功能,并提供24个易用模板,助力用户高效完成专业级图像创作。
(以上内容均由Ai生成)