可灵AI上线主体库,角色跨场景“永不变脸”
快速阅读: 12月8日消息,快手旗下可灵AI发布“主体库”,为O1视频模型新增长期记忆能力,用户上传单图即可跨场景调用一致角色,主体一致性超96%,并推分级服务与2025年多人功能规划。
今日,快手旗下可灵AI正式发布“主体库”(Subject Library),为O1多模态视频模型新增“长期记忆”能力。用户上传单张角色图像后,系统可自动生成3D视角补全与多光线变体,并支持跨场景通过“@角色名”一键调用。官方数据显示,该技术实现主体一致性超过96%,有效解决AI生成中常见的“变脸”问题。
该主体库采用三步操作流程:首先自动完成图像抠图、对齐与色彩归一;随后由AI生成侧脸、背面及局部细节,提供三组补全方案供选择;最后用户在提示词中输入“@角色名”,即可在任意镜头、光照或艺术风格下保持角色面部与服饰细节一致。此外,系统还能智能提取发色、服饰与风格特征,自动生成60字以内关键词,实验表明此举使复杂场景一次生成成功率提升27%,平均节省12分钟调参时间。
主体库与O1模型的文本生视频、图像生视频及首尾帧控制功能共享底层latent空间,确保同一角色在多段视频中连续出现时ID漂移低于0.03,并支持48fps/1080p输出,单条视频最长可达5分钟。自2024年上线以来,Kling AI已迭代30余次,累计生成视频达2亿条。
目前,该功能已面向不同用户推出分级服务:免费版支持存储5个主体、每月50次调用;Pro版29元/月,主体数量无上限,并含600次调用及5分钟高清生成;企业API按0.005元/次计费,支持私有化部署与品牌定制。据悉,可灵AI计划于2025年第一季度推出“多人主体库”与“实时风格化”功能,支持单画面锁定三位角色并动态切换卡通、复古、赛博等全局风格,进一步拓展在长剧、广告及游戏动画领域的应用。
(以上内容均由Ai生成)