智谱开源四项视频生成核心技术

发布时间:2025年12月12日    来源:szf
智谱开源四项视频生成核心技术

快速阅读: 据智谱团队消息,12月12日,该团队在开源周活动中发布四项视频生成核心技术及多款多模态模型,涵盖角色动画、实时生成与多主体一致性等方向,旨在降低训练成本、提升生成质量,并推动社区协同创新以加速通用人工智能发展。

在近日举行的智谱多模态开源周活动中,智谱团队宣布开源四项视频生成核心技术,涵盖精细化可控生成、复杂时空结构建模及大规模训练成本优化等方向,旨在推动视频生成技术的发展。

过去一周,该团队陆续发布多个多模态模型,包括GLM-4.6V视觉理解模型、AutoGLM设备控制模型、GLM-ASR语音识别模型和GLM-TTS语音合成模型,以增强大模型在世界知识、记忆与复杂推理方面的能力。此外,在开源周收官之日,团队进一步推出SCAIL、RealVideo、Kaleido和SSVAE四项新技术。

其中,SCAIL聚焦影视级角色动画生成,可精确控制复杂姿态并保障运动中的结构完整性;RealVideo为实时流式视频生成系统,将输出延迟压缩至2至3秒,显著提升人机交互流畅度;Kaleido面向多主体视频生成,有效避免主体间特征混淆,确保一致性;SSVAE则通过优化训练流程,使模型在同等质量下收敛速度提升三倍。

智谱团队表示,此次开源意在激发社区创新活力,为开发者提供扎实的工程方案与研究基础。同时,该团队期待与全球开发者协同推进人工智能技术演进,助力通用人工智能(AGI)的实现。

(以上内容均由Ai生成)

你可能还想读

埃森哲停止披露AI收入但Q1增长强劲

埃森哲停止披露AI收入但Q1增长强劲

快速阅读: 埃森哲公司在声明中表示,其2026财年一季度新订单达209亿美元,先进AI相关订单同比激增76%至22亿美元,营收达187.4亿美元并触及指引上限。公司称AI已深度融入整体业务,将不再单独披露相关数据。 埃森哲公司于近日发布20 […]

发布时间:2025年12月19日
Coursera与Udemy合并加速AI人才培养

Coursera与Udemy合并加速AI人才培养

快速阅读: 据官方透露,受人工智能快速发展影响,企业正转向模块化培训以提升员工AI技能。优达学城与Coursera合并后将构建统一技能记录系统,助力企业动态追踪并培养人才,增强应对技术变革的能力。 近日,亚马逊旗下AWS培训与认证项目董事总 […]

发布时间:2025年12月19日
微软Copilot假日广告承诺落空

微软Copilot假日广告承诺落空

快速阅读: 截至发稿时,用户反映微软Copilot在将食谱份量扩增至14人份时计算中断,并误将网页上的整数倍按钮识别为精确调节控件,最终未能输出调整后的食材清单,暴露出其在连续数值处理与界面理解方面的不足。 近日,有用户反映在使用人工智能助 […]

发布时间:2025年12月19日
谷歌Home应用支持批量迁移Nest设备

谷歌Home应用支持批量迁移Nest设备

快速阅读: 据谷歌消息,Google Home应用现已支持一次性迁移多台旧版Nest设备,涵盖恒温器、摄像头、智能门锁及烟雾报警器,大幅简化此前繁琐的手动操作流程,以加速向统一平台整合并优化用户体验。 谷歌近日在更新日志中宣布,Google […]

发布时间:2025年12月19日
美光称存储芯片短缺将持续至2026年后

美光称存储芯片短缺将持续至2026年后

快速阅读: 据官方透露,亚马逊数字广告平台在美国月活广告受众超3亿,依托Prime Video原创内容及与Netflix等平台的合作,覆盖用户全链路场景,并通过互动广告与营销云AI技术提升品牌营销精准度。 亚马逊数字广告平台(Amazon […]

发布时间:2025年12月19日
Patronus AI推出智能体训练模拟器

Patronus AI推出智能体训练模拟器

快速阅读: 据Patronus AI消息,该公司本月推出“生成式模拟器”,通过动态创建任务与实时更新规则,构建“活态”训练场以提升AI智能体的任务执行能力,并提出“开放递归自改进”机制,支持智能体在无需重训练的情况下持续优化。 人工智能领域 […]

发布时间:2025年12月19日
联想AI战略的五大落地路径

联想AI战略的五大落地路径

快速阅读: 据官方透露,联想集团正系统推进AI规模化应用,已注册超1000个相关项目,并通过“组合式”策略覆盖从试点到全公司推广的全周期。为应对数据监管与技术不确定性,公司强化区域化部署,建立AI工具白名单机制,并将AI目标纳入高管考核,以 […]

发布时间:2025年12月19日
Lovable融资3.3亿美元估值达66亿

Lovable融资3.3亿美元估值达66亿

快速阅读: 截至报道时,据媒体消息,瑞典AI初创公司Lovable完成3.3亿美元B轮融资,估值达66亿美元。其“氛围编程”工具已吸引Uber等客户,日均新增项目超10万个,新资金将用于拓展企业功能与基础设施。 瑞典人工智能初创企业Lova […]

发布时间:2025年12月19日