字节跳动联手港校开源DreamOmni2,突破AI图像编辑难题

发布时间:2025年10月27日    来源:szf
字节跳动联手港校开源DreamOmni2,突破AI图像编辑难题

快速阅读: 字节跳动与香港多所大学联合研发的DreamOmni2系统正式开源,实现多模态指令理解,大幅提升图像编辑生成技术,为AI创作开辟新途径。

在人工智能图像编辑与生成领域,一项新的突破性技术引起了广泛关注。字节跳动与香港中文大学、香港科技大学和香港大学联合研发的 DreamOmni2系统,已正式开源,标志着图像编辑生成技术的 最新 发展。

DreamOmni2的推出,致力于提升人工智能在图像处理中的指令遵循能力,实现了真正的多模态指令理解。这一系统能够同时理解文本指令与参考图像,显著改善了以往模型在处理抽象概念(如风格、材质、光照)时的局限性。用户与 AI 之间的交互更加自然,仿佛与一个了解自己意图的合作伙伴对话。

为了训练 AI 理解复杂的文本和图像指令,DreamOmni2的研发团队开发了一套创新的三阶段流程。首先,通过训练提取模型,AI 能够精准提取图像中的特定元素或抽象属性。接着,利用提取模型生成多模态指令编辑数据,形成包含源图像、指令、参考图像和目标图像的训练样本。最后,通过进一步提取与组合生成更多参考图像,构建出丰富的多模态指令生成数据集。这一系列步骤为系统的高质量训练打下了坚实基础。

在模型架构方面,DreamOmni2提出了索引编码和位置编码偏移方案,确保模型能够准确识别多张输入图像。同时,引入视觉语言模型(VLM),有效解决了用户指令与模型理解之间的鸿沟。这种创新设计提升了系统在处理指令时的准确性,使其能够更好地理解用户的真实意图。

经过测试,DreamOmni2在多模态指令编辑任务上的表现超越了所有参与比较的开源模型,接近 顶尖 商业模型。与传统的商业模型相比,DreamOmni2在处理复杂指令时,能够提供更高的准确性和一致性,避免了不必要的变更和图像瑕疵。

DreamOmni2的开源,不仅为 AI 创作提供了新的可能性,也为相关领域的研究者提供了统一的评判标准。这一技术的发布,预示着 AI 图像编辑与生成领域即将迎来新的革命。对于未来的发展,业内专家表示,DreamOmni2的成功将极大推动 AI 技术的普及和应用。

(以上内容均由Ai生成)

你可能还想读

Rokid眼镜在台创众筹纪录并正式发布

Rokid眼镜在台创众筹纪录并正式发布

快速阅读: 12月13日消息,Rokid在台湾发布智能眼镜,凸显其在无障碍使用、效率提升等场景的实用价值。此前,该产品在Kickstarter融资超400万美元,成为XR可穿戴领域最高募资项目,反映市场对AI可穿戴设备需求上升。 近日,中国 […]

发布时间:2025年12月13日
拉合尔启用人脸识别摄像头抓捕有案底嫌犯

拉合尔启用人脸识别摄像头抓捕有案底嫌犯

快速阅读: 据行业统计,巴基斯坦拉合尔市在六个入城通道部署AI人脸识别摄像头,可实时识别在逃人员并发出预警,警方随即拦截;此举旨在加强外来人员管控,同时因浓雾导致部分高速公路封闭,当地正优化检查站流程以提升通行效率与安全防控能力。 拉合尔市 […]

发布时间:2025年12月13日
OpenAI警告AI模型或可开发零日漏洞

OpenAI警告AI模型或可开发零日漏洞

快速阅读: 据OpenAI消息,其即将推出的先进AI模型或带来“高”级别网络安全风险,可能自主利用零日漏洞实施复杂攻击;为此公司正强化防御工具、访问控制及监测机制,并将设立前沿风险理事会,优先聚焦网络防御领域。 OpenAI近日警告称,其即 […]

发布时间:2025年12月13日
警方警告警惕无声来电防范AI语音诈骗

警方警告警惕无声来电防范AI语音诈骗

快速阅读: 据马来西亚警方消息,12月13日吉隆坡警方提醒公众警惕无声或突然挂断的陌生来电,此类电话可能被用于AI语音盗用诈骗亲友;虽暂无相关报案,但呼吁民众勿泄露个人信息,遇可疑情况立即举报。 吉隆坡12月13日电 马来西亚警方今日提醒公 […]

发布时间:2025年12月13日
特朗普签署行政令阻止各州制定AI法规

特朗普签署行政令阻止各州制定AI法规

快速阅读: 截至报道时,特朗普于12月12日签署行政令,禁止各州监管人工智能,称统一规则关乎对华竞争,但遭两党反对;该令允许州政府在儿童安全和数据中心等领域例外立法,引发对隐私保护缺失与州权削弱的担忧。 美国总统特朗普于12月12日签署行政 […]

发布时间:2025年12月13日
TikTok助推虚假AI广告泛滥

TikTok助推虚假AI广告泛滥

快速阅读: 据欧盟方面消息,TikTok内置AI广告工具被曝生成大量虚假减肥广告,部分绕过审核机制并链接至仿冒网站,违反平台政策;欧盟委员麦格拉思强调,《人工智能法案》将强化监管,确保创新与用户安全的平衡。 在数字化时代,广告已成为全球主要 […]

发布时间:2025年12月13日
英伟达拟扩产H20芯片以满足中国需求

英伟达拟扩产H20芯片以满足中国需求

快速阅读: 据路透社报道,英伟达正评估扩大面向中国市场的H200人工智能芯片产能,因订单已超过当前产出;特朗普提议要求其将25%销售额上缴美国政府,中方态度积极,美国商务部亦正与其他芯片厂商磋商类似安排。 据路透社报道,芯片制造商英伟达正考 […]

发布时间:2025年12月13日
三星掌门人会见马斯克商讨芯片合作

三星掌门人会见马斯克商讨芯片合作

快速阅读: 截至目前,三星已成为特斯拉多代车载AI芯片的主要制造商,继AI4、AI5后将代工新一代AI6芯片,用于提升自动驾驶与智能座舱功能,深化半导体与新能源汽车产业链融合。 今年7月,三星与特斯拉签署协议,为后者未来电动车型代工生产新一 […]

发布时间:2025年12月13日