字节跳动推Vidi2,AI视频编辑超越Gemini 3 Pro

发布时间:2025年12月1日    来源:szf
字节跳动推Vidi2,AI视频编辑超越Gemini 3 Pro

快速阅读: 字节跳动发布AI视频编辑器Vidi2,具备细粒度时空定位能力,可自动剪辑长视频,降低创作门槛,推动AI从辅助工具向核心生产力转变。

字节跳动AI视频革命:Vidi2正式发布 中国科技巨头字节跳动近日重磅推出全新人工智能视频编辑器Vidi2,这款工具以其革命性的视频理解和创作能力震惊业界。据 最新 技术评估,Vidi2在视频理解深度上已超越谷歌Gemini3Pro,成为当前 最先 进的视频多模态模型。该模型专为长时序视频设计,能够处理数小时海量素材,并基于简单提示词自动生成脚本、TikTok短视频或完整电影,极大降低了视频创作门槛。

Vidi2的发布标志着字节跳动在AI多模态领域迈出关键一步。作为TikTok和抖音的母公司,字节跳动长期深耕短视频生态,此次工具的推出将进一步赋能全球内容创作者,推动AI从辅助工具向核心生产力转型。

核心技术突破:时空定位与端到端编辑 Vidi2的核心在于其细粒度时空定位能力,能够精准捕捉视频中特定动作和对象的出现位置与时间段。传统视频AI往往难以“阅读”完整长视频,导致事件起始、结束及参与主体识别失准,而Vidi2通过多模态编码器和语言模型骨干,融合文本、视觉帧和音频输入,实现像素级分析。

具体而言,用户只需输入文本查询,模型即可返回精确的起止时间戳及目标对象的边界框轨迹(bounding box tube)。例如,在一段数小时的纪录片中,查询“猫咪跳跃场景”,Vidi2不仅定位秒级片段,还能自动提取并剪辑成独立短片。该模型采用自适应视觉令牌压缩技术,确保内存高效利用,即使面对极短或极长剪辑,也能保持关键上下文完整。

在基准测试中,Vidi2在VUE-STG(时空管基准)和VUE-TR-V2(时序检索基准)上大幅领先Gemini3Pro和GPT-5等商用模型。视频问答任务中,其准确率提升显著,特别是在情节感知自动编辑环节,支持一键裁剪、添加字幕、重构故事图谱等功能。字节跳动团队表示,该模型训练数据融合合成剪辑与海量真实视频,确保生成内容高保真且流畅自然。

应用场景创新:从素材搜索到智能脚本生成 Vidi2不仅仅是编辑器,更是智能创作助手。其端到端工作流让视频生产从人工拉轨转向自然语言驱动:输入主题提示,模型自动输出标题、钩子、分镜脚本,并生成成品视频。创作者可轻松将长素材转化为TikTok竖屏短片,或扩展为电影级叙事,适用于新闻、广告、娱乐等领域。

想象一下,纪录片导演上传数小时原始镜头,只需提示“聚焦环保主题的励志故事”,Vidi2即生成完整脚本并剪辑大纲。这不仅加速了迭代过程,还提升了创意表达的包容性。即使非专业用户,也能通过简单对话实现专业级输出。

行业影响与未来展望 Vidi2的问世加剧了全球AI视频赛道的竞争。字节跳动借此巩固其在多模态AI的前沿地位,此前其MagicVideo系列已展现文本到视频生成的潜力,而Vidi2则聚焦理解与编辑闭环。专家预测,该工具将重塑内容产业生态,降低生产成本,推动短视频向长形式转型。

目前,Vidi2已在arXiv预印本发布,GitHub仓库开放源代码,演示版即将上线。字节跳动强调,将持续优化模型以支持更多语言和场景,助力AI普惠创作。

(以上内容均由Ai生成)

你可能还想读

美国科技未来需投资人才与科研

美国科技未来需投资人才与科研

快速阅读: 据最新消息,美国政府拟持股英特尔10%,以强化半导体战略,但专家强调需同步加大基础科研投入并解决STEM人才短缺,方能维系科技领先地位。 近日,美国政府宣布将持有英特尔公司10%的股权,引发广泛关注。此举被视为对本国半导体制造业 […]

发布时间:2025年12月8日
康宁押注AI数据中心光纤需求激增

康宁押注AI数据中心光纤需求激增

快速阅读: 据康宁公司介绍,AI数据中心加速转向光纤互联,单节点集成72颗GPU,布线长达两英里;因算力激增与带宽需求,光通信将推动AI硬件生态结构性变革,市场或扩至三倍。 近日,人工智能硬件基础设施加速升级,数据中心内部连接技术正经历重要 […]

发布时间:2025年12月8日
智能体AI重塑政府与民众服务关系

智能体AI重塑政府与民众服务关系

快速阅读: 据最新消息,AI代理技术在能源、环保、医疗和教育等领域试点成效显著,提升地震解释准确率70%,优化垃圾清运与课程设置,推动公共服务向智能优化转型。 近日,人工智能代理技术在公共服务领域展现出显著应用潜力。今年1月,阿布扎比国家石 […]

发布时间:2025年12月8日
英警方呼吁中央统筹AI应用

英警方呼吁中央统筹AI应用

快速阅读: 据techUK发布消息称,英格兰和威尔士警方需建立中央统筹机制并加大投入,以释放AI在执法中的潜力,解决应用不均、数据质量及算法偏见等问题,推动全国协调与透明治理。 英国信息技术行业组织techUK近日发布报告指出,英格兰和威尔 […]

发布时间:2025年12月8日
Viam携手优傲机器人推AI自动化方案

Viam携手优傲机器人推AI自动化方案

快速阅读: 据最新消息,美国Viam公司与优傲机器人达成合作,基于UR系列协作机器人开发AI驱动的表面处理系统,已应用于船舶打磨,并拓展至家具、建筑等行业,推动制造智能化转型。 近日,美国纽约企业Viam宣布与泰瑞达集团旗下优傲机器人公司( […]

发布时间:2025年12月8日
AI智能体破解医疗沟通困局

AI智能体破解医疗沟通困局

快速阅读: 据最新消息,美国医疗系统因信息孤岛问题导致患者沟通受阻,AI智能体技术正通过代理式通信提升诊疗协同效率,企业Infinitus已推动该方案在随访与用药管理等场景落地。 近日,美国医疗系统在信息互通方面面临的严峻挑战引发广泛关注。 […]

发布时间:2025年12月8日
AI虚拟演员Tilly Norwood引行业争议

AI虚拟演员Tilly Norwood引行业争议

快速阅读: 据美联社报道,AI虚拟演员蒂莉·诺伍德由Particle6公司打造,旨在探索影视AI应用,团队正优化其自然表现并计划明年推出互动功能,但遭部分经纪公司抵制。 近日,人工智能虚拟演员“蒂莉·诺伍德”(Tilly Norwood)再 […]

发布时间:2025年12月8日
苹果硬件主管或离职,芯片业务面临巨变

苹果硬件主管或离职,芯片业务面临巨变

快速阅读: 据彭博社报道,苹果硬件技术主管斯鲁吉考虑离职,其主导自研M系列与A19 Pro芯片,深度支撑全系产品,潜在出走或重创苹果芯片优势并撼动行业格局。 据彭博社日前报道,苹果公司高级副总裁、硬件技术主管约翰尼·斯鲁吉正考虑离职。斯鲁吉 […]

发布时间:2025年12月8日