Lightricks更新LTXV模型 图像转视频突破60秒

发布时间:2025年7月18日    来源:szf
Lightricks更新LTXV模型 图像转视频突破60秒

快速阅读: 据相关媒体最新报道,Lightricks推出开源AI视频模型LTXV,支持生成60秒视频,突破行业8秒限制,具备高效、实时流式生成能力,适用于多种创作场景。

据Lightricks公司宣布,其AI视频生成模型LTX-Video (LTXV) 迎来重大更新,新增支持生成长达60秒的图像到视频内容。这一突破性进展打破了行业常规的8秒限制,使LTXV成为首款支持实时流式生成长篇AI视频的开源模型。

LTXV的最新版本通过引入自回归流式架构,实现了从单一图像生成长达60秒的高质量视频。相较于传统模型的短时输出,LTXV能够在生成过程中实时流式传输视频,首秒内容几乎瞬时呈现,随后持续构建场景。这种技术不仅支持更长的视频生成,还确保了动作和叙事的平滑连贯性,为创作者提供了前所未有的叙事表达空间。

用户可通过输入详细的文本提示,结合初始图像,生成分辨率为768×512或更高(如1216×704)的视频,帧率为24FPS。LTXV的多尺度渲染技术先以低分辨率捕捉粗略动作,再逐步优化细节,确保视频在速度与质量之间达到最佳平衡。

LTXV模型的更新还引入了动态场景控制功能,允许用户在视频生成过程中实时调整姿势、深度或风格等元素。借助Lightricks的IC-LoRA技术,创作者可以持续应用控制信号(如姿势检测或边缘检测),实现对视频细节的精准把控。这种“边生成边导演”的能力,使得LTXV从单一的提示生成工具,转变为真正的长篇叙事平台。

此外,LTXV支持多种生成模式,包括文本到视频、图像到视频、关键帧动画以及视频扩展,用户甚至可以结合多个图像或短视频片段作为条件,生成复杂的视频内容。这种灵活性使其适用于从社交媒体短视频到交互式教育内容、甚至实时AR视觉效果的广泛场景。

LTXV的另一个亮点是其高效性和硬件友好性。得益于130亿参数的模型架构和bfloat16精度优化,LTXV能在消费级GPU(如NVIDIA RTX4090或5090)上以极低的VRAM需求(最低8GB)运行,生成60秒视频仅需数秒。例如,在H100GPU上,LTXV可在4秒内生成5秒视频,速度快于实时播放。相比之下,竞品模型如OpenAI的Sora通常需要多GPU集群支持,计算成本高昂。

作为开源模型,LTXV的代码和权重已在GitHub和Hugging Face上免费提供,遵循LTXV Open Weights License,支持学术研究和社区开发。Lightricks还发布了配套工具,如LTX-Video-Trainer和ComfyUI集成工作流,进一步降低使用门槛。

Lightricks的此次更新将AI视频生成推向了新的高度。60秒视频生成能力的突破,不仅为独立创作者、营销团队和游戏开发者提供了快速生成长篇内容的能力,也为实时交互式应用(如动态AR视觉或玩家驱动的游戏过场动画)奠定了基础。

社交媒体反馈显示,用户对LTXV的速度和质量赞不绝口。有用户表示,在RTX4080上生成768×512视频仅需45秒,而60秒视频的生成效果也令人惊叹,尽管部分用户提到工作流设置仍需优化。

然而,LTXV的非商业用途限制(仅限学术和研究)可能对部分商业创作者构成挑战。Lightricks表示,未来将在其旗舰平台LTX Studio中推出支持60秒视频的商业版本,进一步扩大应用场景。

AIbase认为,LTXV的更新重新定义了AI视频创作的可能性,其开源策略和高效性能将加速行业创新。未来,随着模型的进一步优化,LTXV有望在专业影视制作和实时内容生成领域占据重要地位。

(以上内容均由AI生成)

你可能还想读

保守活动人士因谷歌AI生成虚假信息起诉谷歌

保守活动人士因谷歌AI生成虚假信息起诉谷歌

快速阅读: 保守活动人士罗比·斯塔巴克因谷歌AI系统生成关于他的虚假信息,将其诉至特拉华州法院,要求至少1500万美元赔偿。谷歌称此为Bard误判所致,已尽力处理。 保守活动人士罗比·斯塔巴克周三对谷歌提起诉讼,指控这家科技巨头的人工智能系 […]

发布时间:2025年10月23日
拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

拉夫劳伦推出AI购物体验,个性化服务引领未来时尚

快速阅读: 拉尔夫劳伦与微软合作推出AI对话购物工具“Ask Ralph”,提供个性化风格灵感,强调技术应提升品牌体验而非目的本身,展现AI个性化体验趋势。 9月,拉尔夫劳伦(与微软合作)发布了“Ask Ralph”,这是一款被描述为“由人 […]

发布时间:2025年10月23日
荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

荣耀转型AI终端生态公司,方飞详解1 x 3 x N战略

快速阅读: 荣耀董事长吴晖宣布转型为AI终端生态公司,提出1 x 3 x N战略,涵盖HONOR AI Connect平台及多项赋能措施,推动AI场景化落地,涉及教育、家居、健康等多领域。 感谢IT之家网友 風見暉一 的线索投递! IT之家 […]

发布时间:2025年10月23日
微软Photos推AI绘图与智能重塑新功能

微软Photos推AI绘图与智能重塑新功能

快速阅读: 微软在其Photos应用中推出AI驱动的Restyle Image和Image Creator功能,前者可智能重塑照片风格,后者能根据描述生成高质量图像,均支持隐私保护,旨在提升图像创作体验。 微软近日在其 Photos(照片) […]

发布时间:2025年10月23日
2025新一代人工智能创业大赛启动 全球招募火热进行中

2025新一代人工智能创业大赛启动 全球招募火热进行中

快速阅读: 网易传媒启动2025新一代人工智能创业大赛,聚焦AI新技术与应用,设三大赛道,面向A轮前团队,奖金总额100万元,提供多维指导与资源支持。 2025年10月22日,网易传媒正式启动 “2025新一代人工智能创业大赛”,面向全球创 […]

发布时间:2025年10月23日
谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

谷歌量子芯片Willow实现可验证量子优势,性能超13000倍

快速阅读: 谷歌发布量子芯片Willow,成功运行“量子回声”算法,实现首个可验证的量子优势,比超级计算机快13,000倍,为新药研发和材料科学开辟新途径。 继量子计算研究团队荣获诺贝尔物理学奖之后,谷歌再次取得突破性进展。当地时间10月2 […]

发布时间:2025年10月23日
马斯克宣布Cybercab与Optimus V3明年投产,聚焦AI与机器人

马斯克宣布Cybercab与Optimus V3明年投产,聚焦AI与机器人

快速阅读: 特斯拉发布2025年Q3财报,营收创新高但利润下滑;马斯克强调AI与机器人业务,FSD14.1更新,Cybercab明年投产,Optimus V3明年一季度亮相。 北京时间10月23日,特斯拉发布2025年第三季度财报,显示公司 […]

发布时间:2025年10月23日
微软Windows 11 Copilot如何卸载

微软Windows 11 Copilot如何卸载

快速阅读: 微软宣布Windows 11更新,引入Copilot为核心的人工智能助手,实现文本语音互动、指导支持及代理操作。此举虽与谷歌等公司类似,但引发部分用户隐私担忧,微软已调整部分AI功能计划。 上周,微软宣布了一系列更新,使每一台W […]

发布时间:2025年10月23日