loading image

说实话,我最近对AI客服的态度变了~

说实话,我最近对"AI客服"这件事的态度变了。

Posted by Enovace on January 14, 2026

说实话,我最近对"AI客服"这件事的态度变了。

之前跟朋友吐槽,说现在找个人工客服比登天还难——你输入"人工"、"转人工"、"我要投诉",AI机器人愣是装听不懂,一个劲儿给你推送FAQ链接。好不容易转到人工了,客服又说"您稍等我查一下",然后就是漫长的等待。

但最近接触了几家用上新一代客服Agent的企业,真的刷新了我的认知。

不是那种关键词匹配的"智障机器人",也不是动不动就"一本正经胡说八道"的大模型——而是真正能干活、干对活的那种AI客服

我就特别好奇,这玩意儿到底怎么做到的?

图像

秘诀在“鸡尾酒模型”——大小模型分层协同

深入了解之后才发现,客服3.0时代的关键不是“用小模型还是大模型”,而是“怎么让它们配合干活”

很多企业做AI客服,要么只靠小模型——速度快但服务僵硬,稍微复杂点的问题就翻车;要么全依赖大模型——能聊天了,但成本高到离谱,还动不动出现"幻觉",给用户推荐一堆根本不存在的产品。

网易云商的客服Agent做了一个这样的设计——大小模型分层协同,就像调鸡尾酒一样,不同基酒按比例混搭,才能调出最佳口感。

70%的基础问题交给小模型处理——查询订单、门店地址、发票怎么开,这些高频、标准化的问题,小模型反应快、答案准,一秒秒就能搞定。

30%的复杂场景留给大模型——用户问"老年人适合什么益生菌",或者说"衣服不合适"但没说明白到底是退货还是换码,这时候就需要大模型上场——理解上下文、主动追问、结合知识库生成专业回答。

更关键的是动态协同机制

当用户先问"杭州门店",再问"滨江区银泰店几点关门",大模型能自动串联上下文,明白你问的是"杭州滨江区银泰门店",无需重复说明。

当用户说"等了半小时还没解决",情绪识别触发后,大模型立刻切换柔性应对模式,安抚+收集关键信息后转人工,避免体验恶化。

这就是"鸡尾酒模型"的精髓——不是简单的“小模型处理简单问题,大模型处理复杂问题”,而是让它们像一个团队一样进行分工协作,既保证响应速度,又保证服务质量,还把成本控制在合理范围。

图像

它真的管用吗?看看这些企业的数据

说实话,我一开始也半信半疑。毕竟这些年人工智能的概念炎得大家耳朵都要起茧子了,但落地的成果却一言难尽。

直到我看到了一些真实案例和数据,才感觉这事儿确实不一样了。


1、北京一卡通:从30分钟到几分钟的跨越

北京一卡通负责交通智能卡的发售和结算,服务过近2亿用户,旗下有非常多不同类型的卡。

用户有退卡退钱的需求时,从意图识别到卡类型确认、卡状态查询、办理规则告知、办理网点查询,整个过程涉及多轮沟通。以前用传统NLP客服机器人处理,这样一个咨询,整个过程最长需要花费30分钟。

今年4月引入网易云商的客服Agent后,在退卡退资场景下:

• 意图识别准确率接近99%

• 回答准确率超过97%

• 转人工率不足15%

从30分钟到几分钟,这不是优化——这是重构。

2、钱大妈:让客服把时间花在刀刃上

在每一通会话结束后,客服人员都需要花费几分钟甚至更长的时间,来提炼关键信息、打标签分类。

这项工作日复一日,占据了客服团队相当大的工作比重,而且容易出现记录不完整、不准确的情况。

这个客服不得不做还容易做不好的事情,却恰恰是客服Agent驾轻就熟的工作

钱大妈引入网易云商客服Agent后,会话摘要的准确率稳定在85%以上。而王府井通过这个功能,每天可为客服节瘁4-6小时,还为后续服务优化提供了精准的数据支撑。

3、I.T集团:售前咨询从2分钟压缩到17秒

I.T集团这样的时装零售商,店铺集合了全球各地众多品牌,每个品牌有自己的尺码体系、营销活动、优惠政策。

客服团队需要切换不同页面搜索相关信息,日常每月承接近2.5万通会话量,大促期间每月超3.5万,单个售前咨询处理时长约2分钟

引入客服Agent应用在售前询单场景后:

• 售前应答速度提升60%

• 单个售前查询最短只需 17秒

• 大幅释放客服接待压力,提升售前转化率

这些数据都不是实验室数据,而是真刀真枪在实际业务中跑出来的结果

图像

哪些场景最适合用客服Agent?

看完这些案例,我总结了一下,客服Agent在三类场景下的表现特别亮眼。

场景一:“对话复杂度高,需要多轮沟通”

传统以NLP技术主导的客服机器人因为意图理解和上下文记忆能力较弱,在这类复杂咨询上往往表现不佳。

对话没有命中预设的关键词或者稍微一深入,便会卡壳或答非所问,最终只能转接人工,既浪费了时间,也影响了客户的体验。

而一个先进的客服Agent则会像真人专家一样,能够很好地串联起上下文的内容,形成连贯的对话逻辑,并通过主动反问来明确需求,以最高效的方式实现服务闭环。

就像北京一卡通的退卡退资场景,从意图识别到状态确认、再到网点查询,整个过程涉及多轮沟通,但Agent能做到一气呵成

场景二:“虽然很烦但不得不做”

这类任务可能本身并不直接面向客户,却对服务质量、运营效率、服务管理等发挥着至关重要的作用。

举例会话摘要的梳理。在每一通会话结束后,客服人员都需要花费几分钟甚至更长时间,来提炼关键信息、打上标签进行分类。

这项工作日复一日,占据了客服团队相当大的工作比重。但Agent可以快速生成一份结构清晰、要素齐全的会话摘要,包括客户诉求、处理方案、处理结果,还能准确识别客户情绪,为后续工单优先级提供依据。

从准确性角度还是效率角度,客服Agent在这类场景上的表现都超越人工

场景三:“谁做结果都一样”

在客服部门处理的事情中,有一部分咨询的重复性极高,但处理逻辑简单、答案也是偏标准化的

比如问到:发票怎么开、门店电话多少、有哪些网点、会员权益的差异等。这些咨询像一个"时间黑洞",日复一日地吞噬着人工客服大量的宝贵工时。

把它交给一个新手客服和交给一个金牌客服,结果都是一样的,并不会影响客户侧的体验

客服Agent可高效承接那些高度标准化、重复性极高的日常咨询。通过Agent,不仅能快速、稳定地响应,还能确保每一次交互都保持统一、准确的服务标准。

I.T集团就是典型的例子——在售前询单场景应用Agent后,售前应答速度提升60%,单个售前查询时间最短只需要17秒,大幅释放客服侧接待压力。

图像

最后说几句

老实说,看完这些案例和数据,我的态度确实变了。

客服Agent不是那种"答非所问的机器人",也不是"一上来就替代所有人工"的万能药——它好像真能把重复性工作做好,然后让人工把精力花在更有价值的事情上

大小模型分层协同的"鸡尾酒模型",既解决了小模型服务僵硬的问题,又解决了大模型成本高、幻觉多的问题,这种思路本身就很值得借鉴

当然,客服Agent的搭建是一个非常细致的工程。对于业务的理解要非常细,萃取、固化优秀员工的经验很关键——观察一个优秀的员工是怎么干某一件事的,一步、两步、三步将其梳理出来,然后再去看这些步骤能不能用AI替代。

如果你正在纯结客服成本、或者想提升服务体验,真的可以去了解一下新一代的客服Agent。

不是说一定要用网易云商的,但他们的"鸡尾酒模型"这个思路和这些真实案例,确实值得参考。

最后附上网易云商官网链接,感兴趣的朋友可以自己去了解:

b.163.com/