清华快手合作推出SVG模型,训练效率提升6200%

发布时间:2025年10月29日    来源:szf
清华快手合作推出SVG模型,训练效率提升6200%

快速阅读: 清华大学与快手合作推出SVG模型,解决VAE“语义纠缠”问题,训练效率提升6200%,生成速度提高3500%,FID值达6.57,支持多任务应用。

在近期的科技界,VAE(变分自编码器)正在经历被逐步淘汰的尴尬局面,随着清华大学与快手可灵团队的合作,推出了一款名为 SVG(无 VAE 潜在扩散模型)的新型生成模型。此次创新不仅在训练效率上实现了6200% 的惊人提升,而且在生成速度上更是达到了3500% 的飞跃。

VAE 在图像生成领域的衰退,主要源于其存在的 “语义纠缠” 问题。也就是说,当我们尝试仅仅改变图像中某一特征(如猫的颜色)时,其他特征(如体型、表情)往往也会受到影响,导致生成的图像不够精准。为了解决这个问题,清华与快手的 SVG 模型采取了不同的策略,主动构建了一个融合语义与细节的特征空间。

在 SVG 模型的设计中,团队首先使用 DINOv3预训练模型作为语义提取器,该模型经过大规模的自监督学习,能够有效识别和分离不同类别的特征,解决了传统 VAE 模型中的语义混乱。此外,为了补充细节,团队还特别设计了一个轻量级的残差编码器,确保细节信息不会与语义特征相冲突。关键的分布对齐机制则进一步增强了这两种特征的融合,保证了生成图像的高质量。

实验结果表明,SVG 模型在生成质量和多任务通用性方面,全面超越了传统的 VAE 方案。在 ImageNet 数据集上,SVG 模型在仅训练80个周期时,FID 值(衡量生成图像与真实图像相似度的指标)达到6.57,远超同规模的 VAE 模型;而在推理效率上,SVG 模型也显示出卓越的性能,在较少的采样步骤下即可生成清晰图像。此外,SVG 模型的特征空间还可直接用于图像分类、语义分割等多种视觉任务,无需额外微调,大大提高了应用的灵活性。

清华与快手的这一新技术不仅为图像生成领域带来了革命性的变化,更有望在多模态生成任务中展现出强大的潜力。

论文地址:https://arxiv.org/pdf/2510.15301

(以上内容均由Ai生成)

你可能还想读

尼日利亚新闻界呼吁AI应用须伦理包容

尼日利亚新闻界呼吁AI应用须伦理包容

快速阅读: “更安全媒体倡议”组织近日在研讨会上指出,AI在提升新闻效率的同时带来真实性、安全与性别偏见等挑战,呼吁建立共享伦理框架,强化人工审核、性别审计及记者培训,以保障新闻公信力。 近日,媒体行业相关方呼吁新闻机构在人工智能(AI)加 […]

发布时间:2025年12月14日
韩国下月实施新人工智能法规

韩国下月实施新人工智能法规

快速阅读: 据韩国互联网企业协会消息,韩国将于2026年1月22日实施全球首部《人工智能框架法》,设立国家AI委员会并强制披露部分系统信息;业界普遍反映准备不足,98%受访企业未建合规机制,担忧严规抑制创新,部分初创公司或转向日本等监管较宽 […]

发布时间:2025年12月14日
三星AI洗衣机节能30%

三星AI洗衣机节能30%

快速阅读: 据三星公司消息,其AI节能模式可显著降低家电能耗,使用频率越高效果越明显;公司计划于2026年1月CES展推出搭载该技术的新品,通过学习用户习惯动态优化能效,响应全球节能减排趋势。 三星公司近期发现,其AI节能模式在运行过程中可 […]

发布时间:2025年12月14日
40款开源工具重塑安全防护体系

40款开源工具重塑安全防护体系

快速阅读: 据联想消息,2025年12月14日,企业加速部署具自主决策能力的AI智能体,带来新型安全风险;开源工具、LLM防护框架及密码管理实践同步演进,以应对碎片化IT环境与合规挑战。 近期,网络安全领域呈现多项重要发展趋势。开源安全工具 […]

发布时间:2025年12月14日
SpaceX与OpenAI引领前沿科技估值飙升

SpaceX与OpenAI引领前沿科技估值飙升

快速阅读: 截至目前,据媒体报道,SpaceX与OpenAI作为前沿科技代表,分别推进火星殖民与通用人工智能研发,带动AI、机器人及国防科技领域多家初创企业估值破百亿美元,投资热度持续高涨。 SpaceX致力于实现多行星生命并殖民火星,而O […]

发布时间:2025年12月14日
AMD发力数据中心挑战英伟达

AMD发力数据中心挑战英伟达

快速阅读: 据美国超威半导体公司消息,其上季度数据中心业务收入达43亿美元,同比增长22%,虽远低于英伟达同期512亿美元,但公司表示新推AI与高性能计算方案有望提升竞争力并争夺市场份额。 美国超威半导体公司(AMD)近年来在图形处理器领域 […]

发布时间:2025年12月14日
AI中的“艺术”:重新审视人工智

AI中的“艺术”:重新审视人工智

快速阅读: 据官方通报,专家提出应将人工智能视为艺术实践而非纯科学技术,以更好理解其社会角色与治理需求;人工智能兼具技术与创造性特征,需构建多维认知框架,平衡创新激励与风险防控。 近日,有关人工智能(AI)本质的讨论引发广泛关注。有观点指出 […]

发布时间:2025年12月14日
2026年人形机器人崛起:安全、隐私与就业挑战

2026年人形机器人崛起:安全、隐私与就业挑战

快速阅读: 据Agility Robotics消息,其研发的Digit人形机器人已在仓库轮班作业,但因安全限制仍需与人类隔离;公司正开发人类识别技术以拆除屏障,同时家庭场景应用面临隐私、成本及公众信任等多重挑战。 人形机器人有望在来年更多进 […]

发布时间:2025年12月14日