AI 托管商家经营 1688 电商 AI 落地实战
作者|刘祥宇
编辑|Kitty
策划|QCon全球软件开发大会
如何通过AI技术帮助商家提升线上运营能力,从而提升商家的经营效果是一个具有挑战性的命题。在10月18-19日举办的QCon全球软件开发大会2024(上海站)上,阿里巴巴淘天集团技术专家刘祥宇分享了《AI托管商家经营:1688电商AI落地实战》,他结合1688商家端的AI实战,向参会者介绍了面向商家提供的AI智能化服务,包括咨询问答、客户管理、商品运营、经营计划等工作,以及业界领先的AI经营托管能力,并阐述相关的技术方案和踩坑经验。演讲内容备受好评,在本次QCon刘老师收获“明星讲师”荣誉。12月13日-14日,InfoQ中国旗下的AICon全球人工智能开发与应用大会将在北京举办,AIAgent技术突破与应用、大模型行业落地实践等精彩专题正陆续上新,欢迎关注。
以下是QCon新晋明星讲师刘祥宇老师的演讲实录,作者第一视角整理。
什么是电商托管
这一年来,托管的经营模式可谓是电商领域最”时髦”的词,我们的AI落地,也围绕托管模式展开,所以,请允许我花一点时间梳理一下。
简单来说,托管的意思,是我跟你买断货权,然后我来卖,这叫做(全)托管。
在全托管模式下,电商平台不再只充当流量入口的角色,而是直接面向消费者充当卖家,承担实际的销售责任。
在这种模式下,平台不仅提供流量入口,还直接负责商品销售和物流配送等环节,从而实现对整个销售过程的全程管控。
比如卖家只需要把货交给平台在国内的集货仓,后续的物流、履约和售后工作全部由平台方来完成。甚至你的店铺运营工作都可以交给平台,除了负责供货之外,别的什么都不用管,做个甩手掌柜就好了。
如下图所示,电商运营过程中,有很多个环节。每个环节里的每个细分领域,都有人在挖掘赚钱机会。而机会也会因为长链路上的分工重组而不断涌现。而所谓的全托管和半托管,不用过于纠结其定义(每家都不一样),重点要留意的是,托管逻辑的盛行,验证了在新环境里重新梳理分工的价值。不同平台可以根据自身情况,在行业长链路上找新的优化空间。
为什么要做托管?
不论是传统外贸还是跨境电商,相较于国内电商,都繁复很多。
以亚马逊为例,我梳理了跨境电商的主要环节和操作,虽然已经大幅简化,但是还是能看到在备货、物流、资金等领域都复杂很多。
此外,传统外贸则更加专业,光报价环节的价格条款就有FOB、CIF、CFR等多种模式。
因此,如果你是一个商家想做外贸,那么冷启动和前期踩坑交学费是不可避免的。这时,托管模式的优越性就显现出来,商家只需要供货,其他全部由平台来代理。
托管模式的优缺点
这里的优缺点从商家视角和平台视角两方面来阐述。
首先,对于商家来说:
然后,对于平台来说:
托管和自营的区别
不是,但是十分接近了。
我的第一反应是,托管就是传统的自营电商的模式。在仔细研究以后,发现还是有差别。
对比一下几种电商经营模式,自营、POP、托管。
亚马逊、京东、shein都是做自营起家的,但是现在也都逐渐转向POP模式。原因无他,虽然自营可以更极致地控制终端体验,但是投入也很大,规模效应不强。POP依然是解决天花板的不二之选。
全托管模式是平台自营和pop跳蚤市场生态之间的均值回归。与其说平台方、供应链和商家之间的关系在”融合”,不如说这三者之间的边界在平台方的予取予夺之间变得更清晰了。
各个平台的托管的区别
随着shein和temu的崛起,现在各大跨境电商都发布了自己的托管服务。这里对比一下各个公司托管能力的异同。
从商家的角度,分析一下各个平台的特点:
在从平台的角度,对比一下各个平台。这里选取了两张网友的图。
主要的结论是:
托管适合什么样的商家
一图胜千言
上面这张图,将商家所处的发展阶段分为:新手(Newcompany)、进阶(Advancedcompany)、到成熟(Maturecompany)。
将商家获取利润的主要来源分为:依靠供应链(Supplychain)驱动的工厂型商家、依靠精细化运营(Operation)驱动的运营型商家,以及依靠品牌溢价(Branding)驱动的品牌型商家。
因此商家分类的编号为:
对于复合类型的商家来说,会出现NSO、NSOB等。
目前全托管模式合作的商家以中小商家为主,他们对于建立品牌的诉求远小于规模商家,全托管模式更符合中小商家的利益。
国内电商有托管概念吗?
有,对标托管概念的,其实就是代运营行业。本质上就是把经营行为托管给代运营公司。
不过代运营提供的都是”半托管”服务,这得益于国内发达的电商基础设施。
代运营行业非常成熟,这里截取了一份研报的资料来说明。
总的来说,代运营的服务范围涉及到了商家经营的方方面面,不过从我们走访的情况来看,基本上代运营服务都是不保效果的,他们只承诺帮助商家做多少确定性的工作。极少部分的客户会进行利润分成,但是一般占代运营公司业务的10%以下。
AI在其中的机会
当下电商行业越来越”卷”,商家的利润越来越薄,根据我们走访的调研,从商家的净利润来看,基本上是淘系7~8%、抖音4~5%、拼多多0~1%。在这种微利的情况下,商家对降本增效的诉求,其实是非常强的。因此在国内,2B的AI落地场景很多,而且相对2C更有确定性。
下面,我们就重点展开AI在电商商家端的应用场景,并介绍一下其中的核心方案。
AI产业应用发展,
雨后春笋,百花齐放
让我们先Step-BackPrompting一下,看看产业界AI应用的发展情况。
从2022年11月openAI推出chatGPT以来,到今天已经快2年时间,整个AI的学术界和工业界进入一个黄金发展期,AI的应用如雨后春笋般涌现。
在基础模型侧,这是一个靠着算力和数据驱动的领域,巨头们进行着军备竞赛,小企业玩家数量不多但也有一些特色的产品出现。整体而言,这是一个残酷的赛道,最终比拼的是资源的总量,未来可能会剩下2~3个最终赢家。
做平台工具的,都是一些聪明人,他们就像是淘金热里卖铲子、卖水、卖牛仔裤的人,通过搭桥铺路来获取回报。这些厂商是否可以长足发展,取决于上层的应用侧是否可以进一步发展。
而上层应用端,2B应用侧重于生产力提升,关注效率和成本,这也是比较容易说得清价值的。2C应用的上限更高,但是难度也更大,目前比较火的有知识问答、AI搜索等领域。
回到电商领域,商家为什么需要AI
1688是一个B2B起家的业务,这里有全中国最丰富的工厂类的商家,他们有很强的线下生产的能力,开模、生产、质量把控、物流交付无所不能。
但是,这些商家却严重的缺乏线上经营能力。
就是我们的商家体质和现状,从商家视角来看,他们不懂运营,不熟悉规则,持续被头部商家剥削,他们的多数会逐渐走向流失。
从平台视角来看,这些商家始终不响应平台号召,无法更好的服务买家,也很难贡献商业化价值。
而AI,给了我们这样一个契机。通过AI技术,让我们获取”智能”和”技能”的成本变得低廉。
由于当前的大语言模型具备了不错的通识技能和常识,并拥有了一定的推理能力,叠加上领域内数据的优化,我们完全可以创造出一个比大部分人更懂电商的智能体。
商家经营链路梳理和AI水位评估
我们梳理了商家电商经营的全链路,把商家的经营分成了10个大环节,50个小环节,并对其中AI应用的水位做了评估。
图中,颜色越深代表着AI应用的深度越深。
可以看到,在流量运营、商品运营、广告投放等数字化程度较高的领域,AI有较好的落地。但是在企业管理、供应链领域,AI应用的程度还不深。
常被问的一个问题,
你的目标客户是谁
在项目的初期,很多人会问我们:你们的目标客户是谁?
对于这个问题,我们做了很多讨论和分析,有这样的结论。
我们的演进路线:
从流程智能化,到流程体验重塑
商家端AI我们做了一年多,前半段,我们重点在做AI工具,比如商品标题优化、素材优化、自动回复、广告投放等。
简单来说,就是把商家经营全链路上的事情,用AI重新做一遍。
就这样做了半年,我们发现一个问题。借助AI,商家的经营环节确实更简单了一点,但是,商家该有的动作一个没少。
于是我们决定换换脑子,大家走访了很多商家和代运营公司,分析了这个产业,然后决定通过AI做出一个”代运营公司”,帮助商家简化他们的经营环节。
关键,我们还免费。
AI经营托管的技术架构
我们除了向商家提供单点的AI工具以外,核心建设了AI经营托管,下面是一个产品截图。
整体思路是,从交付工具价值(处理多少张图片,生成多少个视频),改为交付结果价值(多少个新品破零、多少个新品起量,多少GMV、多少买家数)。
这使得,我们可能是业界第一个通过AI直接向商家交付最终结果的团队。也意味着整体技术难度指数级上升。
打个简单的比方,以前只是提供道路保持能力就行,而现在,我们胆大妄为地踏入了自动驾驶的领域。
这是我们的技术架构图,整体的设计上,我参考了自动驾驶技术,因为我发现两者非常相似。
自动驾驶里,需要通过摄像头进行环境感知(识别道路、行人、红绿灯、其他车辆等),需要有路线规划能力,需要有决策系统,更要有执行控制系统来控制汽车部件(油门、刹车、方向盘等)。
我们也包含了决策规划系统,执行控制系统等,细节不必赘述,大家一看就懂。
什么是一个好的经营计划
对于我们提供的托管类产品来说,如何制定出一个科学的有效的经营计划(Plan)是困难但重要的。这需要同时具备有效性、专业性和可解释性。
在我们当前的方案里,首先会进行选品,不同的商品给出不同的方案。然后进入计划设计环节,会针对广告、营销等不同的方面制定经营计划。这里会针对整体费用做预估和控制,防止生成的计划产生资损。在执行阶段,通过PID和RL来控制线上运行的效果,保持计划执行的稳定性。
我们认为,一个好的经营计划,应该包含目标、时间、人群,品类、定价、营销等要素,综合成一个完整的经营方案。
自动优化图片落地中的踩坑实录
图片生成和优化,是AI落地的第一个场景。在电商领域,可控图片生成是重点工作。
我们团队并没有自研电商图像生成技术,主要是联合集团内团队和三方生态公司的方式提供图片GC能力。
在应用端,由于我们是托管模式,因此相比于工具模式(生成结果并交由商家选择),落地难度陡增。
相当于,我们除了要具备图片生成能力,还要有一套完整的判断图片优劣的上线流程。
这个环节中,如下图所示,我们做了如下工作。
在图片上线的过程中,我们解决了很多困难,比如图片产能的问题,生成效果问题,审核人力问题等。
我们也在实践的过程中发现,商品图片在美学上的”美”,并不等价于用户端的”好”,因此也联合算法团队建设了图片质量评价、CTR预估等工作。
后续这块还会有专题的文章分享。
自动标题优化落地的版本迭代
标题SEO优化是另一个落地场景。这里我们做了三个版本的尝试。
第一版,我们尝试直接用大模型端到端输出,但是效果一般,因为商品的标题本身并不是一句”正常”的话,而是一堆关键词的堆砌,因此模型的表现并不好。
第二版本,我们放弃了用大模型直接输出,而是通过小模型产出一些可替换的关键词,比如热搜词等,然后再结合大模型做整合和标题重写。
这里有个有意思的数据洞察,我们分析了标题优化前后的效果,发现一个”失望”的事实,就是标题优化的效果很不明显。
这意味着,大部分的标题优化可能对商品最终的效果影响不大,我们的工作可能无法被商家感知到。但是,换个角度想,这同时意味着,我们可以适度地”瞎搞”,反正商家也感知不出来[狗头]
在实践中,我们还遇到了一个问题,就是大模型对商品的理解能力不足,会导致一个商品明明是棉袜,但是我们会给它添加”丝袜”的关键词。这可能会带来新增的流量(因为可能是近期热点),但是会导致商家支付转化降低,以及可能会引起潜在的买家投诉。
所以我们利用多Agent来优化标题优化体验。
这里,我们采用了”六顶思维帽”的方法来优化。我们借鉴了其中的思路来进行多Agent联合优化。分别是负责事实新的白色帽子,负责乐观建议的黄色帽子,负责创新的绿色帽子,负责批判的黑色帽子,负责管理的蓝色帽子。还有一个负责情感的红色帽子,这里我们没用上。通过这六个Agent协作,产出最终的结果。
商家端对话任务介绍
B端对话任务和C端对话任务的差异是,B端对话任务更强调效率,不会有太多闲聊、娱乐的内容,重视专业性、准确性。
我们认为有三类问题需要重点去解决。分别是专业知识问答、业务目标牵引、经营数据分析。具体可见上图。
RAG优化
在专业知识问答领域,最常用最好用的技术莫过于RAG了,对于RAG的优化,可以参考下图。
我们做的优化主要在两个环节:
第一,在索引阶段,我们做了chunking优化,针对大的document拆解成段落进行索引;同时在query时改写问题,这个后面也会介绍。
第二,在生成阶段,我们采用了更强的embedding模型,提升向量的表征效果;对于部分场景,采用多路数据源召回并做重排序,以及采用时间衰减因子来提升回答的实效性。综合使用这些方法,让我们的RAG效果在我们自己构建的评测集上,准确率从40%提升至88%,大大提升了线上使用的体验。
多轮对话
对于第二个任务,我们主要依赖多轮对话来提升效果。下面是一个对话任务的流程图。
当用户发起提问的时候,会进行意图识别,先判断是单轮意图还是多轮意图,如果是单轮意图则需要细化是什么具体的意图,然后该用RAG就用RAG,该调用工具就调用工具。
如果是多轮意图,则需要调用历史对话信息,输入到多轮对话中,然后触发问题改写,提升问题回答的质量。
多轮对话问题改写有几个常见的任务,以下是常见的改写情况,分为领域内改写,跨领域改写,跨领域跳转和追问场景。
对于多轮对话改写,我们内部称之为”伪多轮”,因为并没有真正使用大模型本身的长上下文能力。随着大模型本身的发展,以及越来越便宜的token,”真多轮”在我们的场景内也得以应用。
这里说的”真多轮”就是指利用大模型本身的长上下文理解能力,自发的进行多轮对话任务。我们使用剧本方法来约束大模型的行为,保障特定任务下多轮对话不至于太发散。比如下面这个例子,用户在对话中咨询自己的店铺数据情况,这里会触发我们的剧本,剧本要求大模型分析用户的数据并牵引他开通我们的经营计划。于是大模型就会不断的牵引商家完成计划的开启,从而实现业务目标。
数据分析
第三个任务,数据分析,这是B端非常常见的应用场景。数据分析任务可以分为几个难度等级,最简单的就是昨天我的GMV是多少,这种任务通过NL2SQL可以比较容易的实现。关于NL2SQL的优化,网上已经讨论的很多了,这里我重点讨论一下LV5难度的问题,就是流量归因类型的问题。
为什么我的流量涨了,为什么我的流量跌了,为什么我的流量不涨不跌?这是商家对我们的灵魂拷问。
流量归因类问题比较复杂,通常不是简单的通过NL2SQL任务可以完成。这里我们借鉴了蚂蚁团队的Agent分析框架PEERPattern,来更好的完成分析类任务。
在原先的方案中,对于这种复杂的分析类问题,如果直接通过大模型输出,通常会出现一个问题,就是车轱辘话。大模型会回答的面面俱到,但是讲不到要点上,给人一种”说了又好像没说”的感觉。本质上,这是归因能力欠缺导致的。
我们的解决方案,第一是尽可能地收集全面的数据并做好抽象,避免token爆炸,第二是利用PEERPattern来提升归因的准确度。具体的方案可参见上图。
举个例子,利用新的方案,我们评估了一个商家的流量波动情况。这个商家近期的流量有激增,经过专家人工定位,发现是奥运会期间跳水冠军全红婵意外带火了夜光乌龟盲盒这样一个品类,而这个商家就是销售这个产品的,因此有流量上的异动。
通过我们新的方案,让大模型比较准确地捕捉到了外部事件这个因素,给出了”夜光乌龟”的归因定位。
后续展望
得益于整个AI生态的快速发展,外加团队一年多的努力,我们在商家智能经营领域取得了一些小小的成果。特别是对于AI经营托管这个命题,最初团队内部大家都不知道怎么做,业界也没有参考,我们都把它归属于”混沌”这个象限。随着时间的推移,经历过很多停滞、纠结、摸索后,我们找到了一些行之有效的路径。现在,我认为这个问题已经从”混沌”变成了”复杂”,部分任务甚至变成了”繁杂”。
未来,依然有很多问题需要解决,比如经营计划的有效性问题,Agent执行效果问题,风险控制问题等。我相信伴随着大家的努力,再叠上AI产业发展的buff,这些问题都可以解决。
最后,对于这波LLM带动起来的AI产业发展,我认为目前还是极早期阶段,有几个观察:
对于AI应用未来会在哪里产生质变,我觉得需要具备几个条件:
以上就是我们在AI应用上的实践和思考。欢迎一起交流,微信联系hongshaorou2330。
会议推荐
就在12月13日-14日,AICon将汇聚70+位AI及技术领域的专家,深入探讨大模型与推理、AIAgent、多模态、具身智能等前沿话题。此外,还有丰富的圆桌论坛、以及展区活动,满足你对大模型实践的好奇与想象。现在正值8折倒计时,名额有限,快扫码咨询了解详情,别错过这次绝佳的学习与交流机会!