豆包野心初现
快速阅读: 据相关媒体报道,豆包推出超能创意2.0,支持图片复刻、视频解析及绘本生成。依托大模型1.6版本,整合多模态工具,推动从社交向效率工具转型。
据36氪报道,9月20日,北京,豆包开始灰度测试超能创意2.0。这一新版本优化了对模糊意图的处理能力,能够解析图片细节,实现图片复刻,并将不同参考图的灵感元素融合,创作出全新图片。此外,用户还可以通过上传一组人物图片,让超能创意2.0生成一个绘本故事。
超能创意2.0还增加了视频解析能力,支持用户上传视频或视频链接来提取逐字稿,或拆解视频的分镜、脚本和剪辑手法。虽然目前对剪辑手法的拆解还较为模糊,但整体能力相比1.0版本有了显著提升。
这些改进得益于豆包大模型1.6版本的支持,该版本具备深度思考、多模态理解和复杂Agent构建的能力。超能创意2.0还接入了图片生成模型seedream 3.0、图片编辑模型seededit 3.0和视频生成模型seedance 1.0 Pro。
过去几个月,豆包陆续推出了多项能力更新,包括AI播客、应用创造1.0和视频通话等。这些更新使豆包从最初的社交聊天机器人逐渐演变为一个“AI助理+AI办公桌面”的组合。AI助理主要通过移动设备提供随身、人性化的交流服务,而AI办公桌面则通过PC等设备提供复杂需求的解决方案。
字节跳动的AI体系由火山引擎提供的云设施、不断进化的豆包大模型、作为“AI助理+AI办公桌面”的豆包应用以及抖音、耳机、眼镜等载体组成。豆包应用在这一体系中发挥着承上启下的作用,将大模型的能力快速转化为实用工具,并作为字节对外输出AI能力的核心枢纽。
豆包的发展路径显示了其从社交产品到效率工具的转变。最初,豆包被定位为一个通过“打电话”交互方式为用户提供陪伴的产品。随着大模型能力的提升,豆包开始融合文生图、文生视频、音乐生成等基础功能,并推出了电脑版,以浏览器形态出现,强调效率和工具属性。
视频通话功能的加入使用户可以在日常生活中实时向豆包提问,获取商品信息或操作指导。基于深度理解和思维链技术,豆包还开发了创意生图、代码编写等场景化工具。这些功能使豆包实现了从社交产品到效率工具的拓展。
豆包App和电脑版分别强调陪伴和效率,形成了“AI助手+AI办公桌面”的组合。豆包App注重拟人化交互,提供轻量化任务支持;豆包电脑版则强调任务执行能力,适用于复杂工作场景。这种组合让豆包更好地适应不同载体形态,满足用户的多样化需求。
字节跳动在AI领域的布局显示了其强大的野心和完整的思考。豆包作为字节AI to C的核心产品,不仅具备拟人化特点,还能够通过多种端口形态输出AI能力,串联字节体系内的不同C端入口。未来,豆包有望在硬件层面实现更大的突破,尤其是在智能眼镜等新型载体上的应用。
(以上内容均由AI生成)