昆仑万维发布多模态预训练模型 Skywork UniPic
快速阅读: 据相关媒体最新报道,7月30日,昆仑万维开源多模态模型Skywork UniPic,支持图像理解、生成与编辑,性能接近大模型,可在消费级显卡运行。
7月30日,北京,昆仑万维正式推出并开源了多模态统一预训练模型Skywork UniPic。该模型基于自回归路线开发,集成了图像理解、文本到图像生成及图像编辑三大功能,经过大规模高质量数据的端到端预训练,展现出强大的通用性和可迁移性。
Skywork UniPic采用了MAR编码器和SigLIP2主干网络,突破了传统多模态模型在语义信息保留上的限制,实现了跨任务的深度协同。用户只需提供提示词,就能轻松完成图像理解、生成及风格转换等复杂操作,如生成特定场景的图片或进行图像风格编辑。
在性能上,Skywork UniPic以1.5亿参数规模达到了接近大型统一模型的效果,在指令遵循、复杂指令图像生成及图像编辑等测试中表现优异,尤其支持在消费级显卡上流畅运行,大幅降低了技术应用的门槛。
模型的成功得益于其高效的数据构建体系、专门的奖励模型优化以及渐进式的多任务训练策略。通过高效的语料库和分层分辨率训练机制,Skywork UniPic在保证模型性能的同时提升了训练效率,解决了传统方法中的能力权衡问题。
此次开源是昆仑万维推动AI技术普及的重要步骤。此前,公司已开源多个领域的大型模型,Skywork UniPic的加入将进一步促进AI技术成为易用的创意工具。用户可以通过相关链接获取模型权重、技术报告及代码仓库等资源。
(以上内容均由AI生成)