首个直播流AI模型MirageLSD发布 实时视频转换开启新纪元

发布时间:2025年7月18日    来源:szf
首个直播流AI模型MirageLSD发布 实时视频转换开启新纪元

快速阅读: 相关媒体消息,MirageLSD是全球首个AI直播流扩散模型,实时视频转换延迟低于40毫秒,支持多种场景应用,提升内容创作效率。

近日,MirageLSD,全球首个人工智能直播流扩散(Live-Stream Diffusion, LSD)模型正式发布,其强大的实时视频转换能力引发行业热议。这款由Decart AI团队打造的创新模型,能够以不到40毫秒的超低延迟,将任意视频流实时转换为用户期望的场景,为直播、游戏开发、动画制作及虚拟换装等场景带来前所未有的可能性。
实时视频转换,突破传统局限 MirageLSD的发布标志着视频生成技术进入了一个全新的阶段。与传统视频扩散模型需要数秒甚至数分钟的处理时间不同,MirageLSD实现了24帧/秒的运行速度和小于40毫秒的响应延迟,能够实时处理无限长度的视频流。这一突破得益于团队在CUDA Megakernel优化和抗漂移训练上的技术创新,整体效率提升超过100倍,彻底打破了传统视频生成模型在时延和长度上的瓶颈。
无论是来自摄像头、视频聊天、电脑屏幕还是游戏画面,MirageLSD都能作为输入源,实时将视频内容转换为用户指定的场景。例如,您可以将普通的视频通话变成一场星际冒险,或将现实中的木棒对决变成光剑大战。这种无限生成与实时交互的能力,为用户提供了前所未有的创作自由。
简单交互,释放创意潜能 MirageLSD不仅技术强大,其操作方式也极为简便。通过简单的交互方式,如手势控制,用户即可实时改变视频中的外观、场景或服装。例如,在直播中轻轻挥手,就能将背景切换为热带雨林,或将自己的服饰变为虚拟的未来战甲。这种直观的操作方式大大降低了技术门槛,让普通用户也能轻松上手,创造出令人惊叹的视觉效果。
此外,MirageLSD支持连续提示和编辑,用户可以在视频生成过程中动态调整内容,确保输出的画面始终与创意保持一致。这种高度的灵活性和可控性,使得MirageLSD在创意内容生产中展现出巨大潜力。
赋能多场景,30分钟开发一款游戏 MirageLSD的应用场景极为广泛,尤其在游戏开发领域展现出惊人潜力。据悉,开发者可以利用MirageLSD在短短30分钟内快速构建一款游戏,并由该模型自动处理所有图形效果。例如,开发者可以输入任意视频流或游戏画面,MirageLSD能够实时将其转换为全新的虚拟世界,无论是奇幻森林还是赛博朋克都市,都能轻松实现。
除游戏开发外,MirageLSD还在直播、动画制作和虚拟换装等领域展现出巨大价值。主播可以利用该技术实时改变直播场景,动画创作者能够快速生成动态视觉效果,而虚拟换装功能则为电商和时尚行业提供了创新的展示方式。这些应用场景的广泛性,使得MirageLSD成为跨行业的通用工具。
技术突破,引领行业未来 MirageLSD的核心技术——直播流扩散(LSD)模型,基于Diffusion Forcing技术,通过逐帧去噪和历史增强训练,解决了传统自回归模型在长时间生成中的误差累积问题。相比其他视频生成模型,MirageLSD不仅能够生成无限长度的视频,还能保持画面的时间一致性和高质量输出,为实时交互应用奠定了坚实基础。
此外,MirageLSD的开发团队在高效GPU汇编代码和数学优化方面进行了深入探索,显著提升了模型的运行效率。这种技术创新不仅推动了视频生成技术的发展,也为未来的多模态AI模型(如音频、情感、音乐等)铺平了道路。
视频生成的新纪元 作为AI领域的先锋,MirageLSD的发布无疑为视频生成技术开启了新的篇章。其实时性、无限生成能力和简单交互特性,将彻底改变内容创作的方式。从个人创作者到大型企业,MirageLSD都提供了强大的工具,让创意不再受限于技术门槛。AIbase认为,这一技术的广泛应用将加速AI与现实世界的融合,带来更多创新场景。
目前,MirageLSD已开放试用,用户可通过官方网站体验其强大功能。未来,Decart AI团队还将推出更多基于MirageLSD的视频模型,覆盖音频、情感和音乐等多模态领域,进一步拓展AI的边界。
体验地址:https://mirage.decart.ai/

(以上内容均由AI生成)

你可能还想读

三星4nm制程良率突破60%,获超1亿美元AI芯片订单

三星4nm制程良率突破60%,获超1亿美元AI芯片订单

快速阅读: 三星电子4纳米制程良率提升至60%-70%,获美企Tsavorite超1亿美元OPU芯片订单,显示三星在中高端市场重获份额。近期三星还获得中国矿机厂商及特斯拉AI5芯片订单,推进2纳米工艺发展。 12 月 7 日,据韩国媒体《亚 […]

发布时间:2025年12月7日
百度集团:正就分拆昆仑芯进行上市进行评估

百度集团:正就分拆昆仑芯进行上市进行评估

快速阅读: 百度计划分拆昆仑芯科技并筹备上市,预计2026年一季度递交申请,2027年初完成IPO。昆仑芯为百度内部孵化的AI芯片公司,业务增长迅速,2024年营收超10亿元。百度股价受此消息上涨5.01%。 感谢IT之家网友 啊俊 、 D […]

发布时间:2025年12月7日
网红“甲亢哥”直播暴力损毁人形机器人,开发公司起诉索赔

网红“甲亢哥”直播暴力损毁人形机器人,开发公司起诉索赔

快速阅读: 网红IShowSpeed在直播中对人形机器人Rizzbot实施暴力行为,致其严重损坏。Rizzbot开发公司Social Robotics提起诉讼,要求赔偿实际损失和预期利润。 2024年9月,拥有超过5000万粉丝(全平台累计 […]

发布时间:2025年12月7日
AI争议两天内导致PS5、PS4游戏下架

AI争议两天内导致PS5、PS4游戏下架

快速阅读: 顶尖智者预测,未来AI将实现更多功能,各国积极投资,芯片短缺因AI需求激增。目前AI如婴儿,潜力巨大,发展将超越视频游戏等简单应用。 世界顶尖的智者预测,未来人工智能将实现诸多功能,而显然你是正确的!几乎每个国家都在投资人工智能 […]

发布时间:2025年12月7日
英伟达发布CUDA 13.1,引入Tile IR革新GPU编程

英伟达发布CUDA 13.1,引入Tile IR革新GPU编程

快速阅读: 英伟达发布CUDA 13.1,引入CUDA Tile新编程方式,简化AI与加速计算开发,提高代码兼容性和执行效率,支持多代GPU架构。 12月7日,IT之家报道,英伟达本周四发布了全新的CUDA 13.1,这是自2006年CUD […]

发布时间:2025年12月7日
谷歌AI迎头赶上,ChatGPT霸主地位受威胁

谷歌AI迎头赶上,ChatGPT霸主地位受威胁

快速阅读: 谷歌在AI搜索转型初期落后于OpenAI的ChatGPT,但通过Gemini等新产品的推出,逐渐缩小差距,目前在应用下载量和用户参与度上展现强劲增长,正努力重回搜索领域主导地位。 谷歌AI标志 NurPhoto via Gett […]

发布时间:2025年12月7日
政府推AI应用打击非法移民

政府推AI应用打击非法移民

快速阅读: 巴基斯坦政府启动AI应用程序试点,打击非法移民,确保被遣返者不再获签。两部长要求严打假旅行社,改革移民系统,提高签证申请透明度。 伊斯兰堡 —— 联邦政府决定启动一项基于人工智能的应用程序试点项目,以遏制非法移民。该决定是在周五 […]

发布时间:2025年12月7日
摩托罗拉解决方案收购Blue Eye,强化AI安全业务

摩托罗拉解决方案收购Blue Eye,强化AI安全业务

快速阅读: 摩托罗拉解决方案公司2025年第三季度财报超预期,宣布收购Blue Eye,强化公共安全与安保技术。此举促进公司向人工智能视频安全领域发展,提升软件和服务收入,应对传统LMR系统压力。 摩托罗拉解决方案公司近期公布的2025年第 […]

发布时间:2025年12月7日