豆包野心初现

豆包野心初现

发布时间：2025年7月24日来源：szf

快速阅读: 据相关媒体报道，豆包推出超能创意2.0，支持图片复刻、视频解析及绘本生成。依托大模型1.6版本，整合多模态工具，推动从社交向效率工具转型。

据36氪报道，9月20日，北京，豆包开始灰度测试超能创意2.0。这一新版本优化了对模糊意图的处理能力，能够解析图片细节，实现图片复刻，并将不同参考图的灵感元素融合，创作出全新图片。此外，用户还可以通过上传一组人物图片，让超能创意2.0生成一个绘本故事。

超能创意2.0还增加了视频解析能力，支持用户上传视频或视频链接来提取逐字稿，或拆解视频的分镜、脚本和剪辑手法。虽然目前对剪辑手法的拆解还较为模糊，但整体能力相比1.0版本有了显著提升。

这些改进得益于豆包大模型1.6版本的支持，该版本具备深度思考、多模态理解和复杂Agent构建的能力。超能创意2.0还接入了图片生成模型seedream 3.0、图片编辑模型seededit 3.0和视频生成模型seedance 1.0 Pro。

过去几个月，豆包陆续推出了多项能力更新，包括AI播客、应用创造1.0和视频通话等。这些更新使豆包从最初的社交聊天机器人逐渐演变为一个“AI助理+AI办公桌面”的组合。AI助理主要通过移动设备提供随身、人性化的交流服务，而AI办公桌面则通过PC等设备提供复杂需求的解决方案。

字节跳动的AI体系由火山引擎提供的云设施、不断进化的豆包大模型、作为“AI助理+AI办公桌面”的豆包应用以及抖音、耳机、眼镜等载体组成。豆包应用在这一体系中发挥着承上启下的作用，将大模型的能力快速转化为实用工具，并作为字节对外输出AI能力的核心枢纽。

豆包的发展路径显示了其从社交产品到效率工具的转变。最初，豆包被定位为一个通过“打电话”交互方式为用户提供陪伴的产品。随着大模型能力的提升，豆包开始融合文生图、文生视频、音乐生成等基础功能，并推出了电脑版，以浏览器形态出现，强调效率和工具属性。

视频通话功能的加入使用户可以在日常生活中实时向豆包提问，获取商品信息或操作指导。基于深度理解和思维链技术，豆包还开发了创意生图、代码编写等场景化工具。这些功能使豆包实现了从社交产品到效率工具的拓展。

豆包App和电脑版分别强调陪伴和效率，形成了“AI助手+AI办公桌面”的组合。豆包App注重拟人化交互，提供轻量化任务支持；豆包电脑版则强调任务执行能力，适用于复杂工作场景。这种组合让豆包更好地适应不同载体形态，满足用户的多样化需求。

字节跳动在AI领域的布局显示了其强大的野心和完整的思考。豆包作为字节AI to C的核心产品，不仅具备拟人化特点，还能够通过多种端口形态输出AI能力，串联字节体系内的不同C端入口。未来，豆包有望在硬件层面实现更大的突破，尤其是在智能眼镜等新型载体上的应用。

(以上内容均由AI生成)

你可能还想读