可灵AI上线主体库，角色跨场景“永不变脸”

发布时间：2025年12月8日来源：szf

快速阅读: 12月8日消息，快手旗下可灵AI发布“主体库”，为O1视频模型新增长期记忆能力，用户上传单图即可跨场景调用一致角色，主体一致性超96%，并推分级服务与2025年多人功能规划。

今日，快手旗下可灵AI正式发布“主体库”（Subject Library），为O1多模态视频模型新增“长期记忆”能力。用户上传单张角色图像后，系统可自动生成3D视角补全与多光线变体，并支持跨场景通过“@角色名”一键调用。官方数据显示，该技术实现主体一致性超过96%，有效解决AI生成中常见的“变脸”问题。

该主体库采用三步操作流程：首先自动完成图像抠图、对齐与色彩归一；随后由AI生成侧脸、背面及局部细节，提供三组补全方案供选择；最后用户在提示词中输入“@角色名”，即可在任意镜头、光照或艺术风格下保持角色面部与服饰细节一致。此外，系统还能智能提取发色、服饰与风格特征，自动生成60字以内关键词，实验表明此举使复杂场景一次生成成功率提升27%，平均节省12分钟调参时间。

主体库与O1模型的文本生视频、图像生视频及首尾帧控制功能共享底层latent空间，确保同一角色在多段视频中连续出现时ID漂移低于0.03，并支持48fps/1080p输出，单条视频最长可达5分钟。自2024年上线以来，Kling AI已迭代30余次，累计生成视频达2亿条。

目前，该功能已面向不同用户推出分级服务：免费版支持存储5个主体、每月50次调用；Pro版29元/月，主体数量无上限，并含600次调用及5分钟高清生成；企业API按0.005元/次计费，支持私有化部署与品牌定制。据悉，可灵AI计划于2025年第一季度推出“多人主体库”与“实时风格化”功能，支持单画面锁定三位角色并动态切换卡通、复古、赛博等全局风格，进一步拓展在长剧、广告及游戏动画领域的应用。

(以上内容均由Ai生成)