Lightricks更新LTXV模型图像转视频突破60秒

发布时间：2025年7月18日来源：szf

快速阅读: 据相关媒体最新报道，Lightricks推出开源AI视频模型LTXV，支持生成60秒视频，突破行业8秒限制，具备高效、实时流式生成能力，适用于多种创作场景。

据Lightricks公司宣布，其AI视频生成模型LTX-Video (LTXV) 迎来重大更新，新增支持生成长达60秒的图像到视频内容。这一突破性进展打破了行业常规的8秒限制，使LTXV成为首款支持实时流式生成长篇AI视频的开源模型。

LTXV的最新版本通过引入自回归流式架构，实现了从单一图像生成长达60秒的高质量视频。相较于传统模型的短时输出，LTXV能够在生成过程中实时流式传输视频，首秒内容几乎瞬时呈现，随后持续构建场景。这种技术不仅支持更长的视频生成，还确保了动作和叙事的平滑连贯性，为创作者提供了前所未有的叙事表达空间。

用户可通过输入详细的文本提示，结合初始图像，生成分辨率为768×512或更高（如1216×704）的视频，帧率为24FPS。LTXV的多尺度渲染技术先以低分辨率捕捉粗略动作，再逐步优化细节，确保视频在速度与质量之间达到最佳平衡。

LTXV模型的更新还引入了动态场景控制功能，允许用户在视频生成过程中实时调整姿势、深度或风格等元素。借助Lightricks的IC-LoRA技术，创作者可以持续应用控制信号（如姿势检测或边缘检测），实现对视频细节的精准把控。这种“边生成边导演”的能力，使得LTXV从单一的提示生成工具，转变为真正的长篇叙事平台。

此外，LTXV支持多种生成模式，包括文本到视频、图像到视频、关键帧动画以及视频扩展，用户甚至可以结合多个图像或短视频片段作为条件，生成复杂的视频内容。这种灵活性使其适用于从社交媒体短视频到交互式教育内容、甚至实时AR视觉效果的广泛场景。

LTXV的另一个亮点是其高效性和硬件友好性。得益于130亿参数的模型架构和bfloat16精度优化，LTXV能在消费级GPU（如NVIDIA RTX4090或5090）上以极低的VRAM需求（最低8GB）运行，生成60秒视频仅需数秒。例如，在H100GPU上，LTXV可在4秒内生成5秒视频，速度快于实时播放。相比之下，竞品模型如OpenAI的Sora通常需要多GPU集群支持，计算成本高昂。

作为开源模型，LTXV的代码和权重已在GitHub和Hugging Face上免费提供，遵循LTXV Open Weights License，支持学术研究和社区开发。Lightricks还发布了配套工具，如LTX-Video-Trainer和ComfyUI集成工作流，进一步降低使用门槛。

Lightricks的此次更新将AI视频生成推向了新的高度。60秒视频生成能力的突破，不仅为独立创作者、营销团队和游戏开发者提供了快速生成长篇内容的能力，也为实时交互式应用（如动态AR视觉或玩家驱动的游戏过场动画）奠定了基础。

社交媒体反馈显示，用户对LTXV的速度和质量赞不绝口。有用户表示，在RTX4080上生成768×512视频仅需45秒，而60秒视频的生成效果也令人惊叹，尽管部分用户提到工作流设置仍需优化。

然而，LTXV的非商业用途限制（仅限学术和研究）可能对部分商业创作者构成挑战。Lightricks表示，未来将在其旗舰平台LTX Studio中推出支持60秒视频的商业版本，进一步扩大应用场景。

AIbase认为，LTXV的更新重新定义了AI视频创作的可能性，其开源策略和高效性能将加速行业创新。未来，随着模型的进一步优化，LTXV有望在专业影视制作和实时内容生成领域占据重要地位。

(以上内容均由AI生成)

Lightricks更新LTXV模型 图像转视频突破60秒

你可能还想读

英语国家民众对AI更悲观

AI无法替代税务专家的判断与质疑

德州法学院以伦理先行培养AI时代律师

法律团队如何审慎应用自主AI获最大效益

亚马逊推Alexa+迈入全代理AI时代

网传普京持《薄伽梵歌》照片系AI生成

AMD锐龙7 9850X3D泄露：单核加速达5.6GHz

英特尔BMG-G31显卡即将发布

Lightricks更新LTXV模型图像转视频突破60秒