美团发布LongCat-Video,实现高质量长视频生成

发布时间:2025年10月27日    来源:szf
美团发布LongCat-Video,实现高质量长视频生成

快速阅读: 美团LongCat团队发布LongCat-Video,基于Diffusion Transformer架构,具备文本、图像生成视频及视频续写功能,可生成高质量长视频,支持自动驾驶等场景,显著提升创作效率。

今日,美团LongCat团队正式发布了全新视频生成模型——LongCat-Video。此模型以其精确重构真实世界运行状态的能力,标志着美团在探索“世界模型”领域的重大突破。“世界模型”是实现下一代人工智能的关键引擎,可帮助AI更好地理解、预测和重构现实世界的动态。

LongCat-Video基于先进的Diffusion Transformer(DiT)架构,整合了文本生成视频、图像生成视频及视频续写等核心功能。该创新模型通过设定“条件帧数量”,有效实现了任务的灵活区分,在不同输入条件下均能表现出优秀的生成能力。LongCat-Video在文本生成视频方面,可以输出720p、30fps的高清视频,具备开源领域领先的语义理解和视觉表现力。同时,图像生成视频功能可在动态过程中保持参考图像的属性与风格,展现自然流畅的运动效果。

最引人注目的是LongCat-Video的长视频生成能力。该模型经过视频续写的预训练,能够稳定输出长达5分钟的连贯长视频,同时避免色彩偏移、画质下降和动作断裂等常见问题。这一技术进步不仅提高了视频生成的质量,还为自动驾驶、具身智能等深度交互场景提供了坚实的技术支持。

在高效推理方面,LongCat-Video采用“两阶段粗到精生成”策略,结合块稀疏注意力(BSA)和模型蒸馏优化,显著提升了视频生成的速度和质量。模型的推理速度提高了10.1倍,确保在处理长视频时仍能保持高质量的生成效果。

LongCat-Video经过严格的内部和公开基准测试,展示了在文本对齐、视觉质量和运动质量等多个方面的卓越性能,综合能力达到当前开源领域的最先进水平。团队表示,LongCat-Video的发布将极大简化长视频的创作流程,使创作者能够从1秒的灵感迅速发展为5分钟的成品。

为了让更多人体验这一先进技术,美团已在GitHub和Hugging Face平台上发布了LongCat-Video的相关资源。该项目不仅为个人创作者提供了强大的工具,也向整个视频创作行业注入了新的活力。

LongCat-Video的发布,不仅是技术上的进步,也是美团在智能创作领域迈出的重要一步。随着该模型的广泛应用,未来的长视频创作将更加简便且充满创意。

(以上内容均由Ai生成)

你可能还想读

比尔・盖茨女儿也 AI 创业了:时尚电商,刚被塞了 800 万美元投资

比尔・盖茨女儿也 AI 创业了:时尚电商,刚被塞了 800 万美元投资

快速阅读: 菲比·盖茨与索菲娅·基安尼共同创立的AI时尚初创公司Phia获800万美元种子轮融资,将用于组建团队加速发展。Phia推出AI购物助手,帮助用户以最低价购买商品,已吸引超60万用户。 比尔·盖茨的小女儿菲比·盖茨(Phoebe […]

发布时间:2025年10月28日
紫光国微Q3净利润5.71亿,同比增109.55%

紫光国微Q3净利润5.71亿,同比增109.55%

快速阅读: 紫光国微2025年第三季度营收18.57亿元,同比增长33.60%,净利润5.71亿元,增长109.55%。前三季度营收49.04亿元,增长15.05%,净利润12.63亿元,增长25.04%。增长得益于特种集成电路业务需求增加 […]

发布时间:2025年10月27日
华为发布MatePad Pro流金典藏版,售价7799元,成大屏生产力新标杆

华为发布MatePad Pro流金典藏版,售价7799元,成大屏生产力新标杆

快速阅读: 华为 MatePad Pro 流金典藏版开售,配备高端硬件与鸿蒙系统,支持PC级应用,AI深度赋能,提供强大生产力与优质交互体验,售价7799元。 10 月 27 日,华为 MatePad Pro 流金典藏版开售。该套装内含华为 […]

发布时间:2025年10月27日
腾讯发布AI编程助手Ada,提升开发效率

腾讯发布AI编程助手Ada,提升开发效率

快速阅读: 腾讯发布AI程序员Ada,具备一键提需求、自动修复缺陷、生成文档等功能,简化开发流程,提升效率与项目可维护性,已在2025年1024开发者节上成功展示。 在科技飞速发展的今天,人工智能已逐渐成为软件开发不可或缺的组成部分。近日, […]

发布时间:2025年10月27日
ChatGPT集成八大平台,变身生活全能助手

ChatGPT集成八大平台,变身生活全能助手

快速阅读: OpenAI将ChatGPT升级为智能代理,推出八款深度集成应用,涵盖旅行、设计、学习等领域,实现一键操作,提升用户体验,功能目前限美加地区。 OpenAI正在将ChatGPT从“会聊天的人工智能”全面升级为“能办事的智能代理” […]

发布时间:2025年10月27日
谷歌云与Anthropic达成数十亿美元协议,加速AI发展

谷歌云与Anthropic达成数十亿美元协议,加速AI发展

快速阅读: Anthropic与谷歌达成协议,将获100万TPU芯片,增强AI模型Claude的训练与运行能力,此举加强了谷歌在云计算和AI芯片领域的地位。尽管如此,Anthropic仍视亚马逊为主要合作伙伴。 Anthropic 已与谷歌 […]

发布时间:2025年10月27日
自主交易需严格可控,AI风险亟待治理

自主交易需严格可控,AI风险亟待治理

快速阅读: 自主AI代理步入真实市场,提升效率同时带来系统性风险。监管机构警告现有控制措施过时,需构建可证明安全的标准,确保身份、数据输入及决策的透明与不可篡改。 披露:本文观点仅代表作者个人,不代表crypto.news编辑部立场。 在现 […]

发布时间:2025年10月27日
Mooncake破解大模型推理“三角困境”,开源共建智算基础设施

Mooncake破解大模型推理“三角困境”,开源共建智算基础设施

快速阅读: Mooncake项目通过计算存储解耦,解决大模型推理中的成本、吞吐量和长上下文处理难题,采用PD分离和KVCache池化技术,优化用户体验,提高资源利用率,支持多租户和云原生集成,推动AI基础设施发展。 引言:大模型推理落地的“ […]

发布时间:2025年10月27日