一个好的客服Agent的架构需要怎么搭?

0 评论 125 浏览 0 收藏 11 分钟

在电信和电商场景中,客户真正需要的不仅是答案,而是解决方案——一个能'会办'而不仅是'会答'的智能系统。本文深度拆解成熟问答系统的三层架构:意图编排精准区分'问与办',任务执行直接调用接口完成操作,合规校验则为高风险动作加装'刹车'。从知识检索到业务闭环,这套多智能体工作流正在重新定义服务体验的边界。

电信业务、电商业务的场景里,客户的真实目的往往不是”想知道一个答案”,而是”想办成一件事”。客户问”我话费怎么欠了40块”,他真正想要的不只是知道原因,而是最好能顺手把话费充了。客户说”我要退这个订单”,他要的不是退款流程介绍,是直接把退款申请提交了。

所以一个真正成熟的问答系统,光”会答”是不够的,还得”会办”、并且在碰到钱和合规时”稳得住”。这背后是三层架构:意图编排 → 任务执行 → 合规校验,也是企业最常用的多智能体工作流(Multi-Agent Workflow)。

第一层:意图编排——先分清”是问还是办”

所有请求进来,第一件事不是急着检索,而是先判断:这是“问问题”还是“要办事”?

这一层叫意图编排 Agent,是整个系统的总开关。判断为”问问题”→ 交给检索层(就是上一篇讲的:寒暄直接答 / 简单查询走普通 RAG / 关系推理走图谱 RAG / 答不了就兜底);判断为”要办事”→ 交给下一层,任务执行 Agent。

很多系统体验差,问题就出在这层太弱——分不清”问”和”办”。客户明明说”帮我充50″,系统却理解成”想了解充值流程”,给了一篇说明文档,而不是真的去充。意图编排判断错,后面全错。

第二层:任务执行——真正把事办了

如果说检索层是”会说”,这一层就是”会做”。它的工作不是回答问题,而是真正调用工具、把事办了:

客户要充话费 → 单点登录 → 调起充值页面 → 传入金额 → 完成充值客户要改套餐 → 校验资格 → 调用变更接口 → 返回结果客户要退款 → 查订单 → 调退款接口 → 返回退款状态客户要查物流 → 调物流接口 → 返回轨迹

这一系列”标准动作”,业内叫Skill(技能)。每个 Skill 封装了四样东西:什么时候该触发它、需要哪些参数、执行什么样的标准流程(SOP)、调用哪个接口或链接。这些 Skill不是凭空来的,是事先调研高频办事场景、把标准作业流程固化下来的一批——调研发现”充话费、查账单、补卡、改套餐”是客户最常办的几件事,就先把这几个做扎实,其余长尾需求再慢慢补,或者先转人工。

我们分析过大量Badcase案例,发现很多低分回复不是召回错误,也不是答案找不到,而是“找到了产品却没给下一步”——临门一脚没踢出去。客户问”推荐个流量包”,系统推荐得很好,却不给订购入口,客户还是办不了。

补齐这一层,有两种程度:给一个办理链接,比什么都不给强,但客户还要自己点、自己操作;直接调 Skill 把事办了,客户说”帮我充50″,系统确认后直接完成充值。从“告诉你怎么办”到“直接帮你办”,这是问答系统真正的分水岭。

第三层:合规校验——碰钱碰合规,必须有道”刹车”

但”会办事”是一把双刃剑。查知识答错了,顶多是答案不好看;可执行 Skill 错了,是真的把钱划走了、真的把套餐改了、真的把订单退了。这种带”副作用”的动作,绝不能识别到意图就直接执行。

所以在任务执行之前,尤其是涉及费用、合规、隐私、不可逆操作的时候,系统必须再加一层”刹车”——合规校验 Agent。它在 Skill 真正执行之前,独立地、完整地审一遍这次操作:这次操作合规吗?有没有违反营销规则、给不符合资格的客户办了优惠?参数对吗?”充50″会不会被误识别成”充500″?需不需要人来拍板?

这层有几个设计要点。它是独立的第二次判断,不是走个过场——前面的意图编排判断的是”用户想干嘛”,这一层判断的是”这么干安不安全、合不合规”,两次视角不同,后者专门盯风险。它还需要分级:查物流、查账单这种只读、无副作用的直接放行;充值、改套餐、退款这种动钱的要二次确认;大额、批量、高风险的必须拉人工——用风险等级决定刹车的力度。最后,确认动作要让人看懂,”确认要为188****8888充值50元吗”,把关键参数摆出来,而不是一句模糊的”确认执行吗”。

这一层是系统的”安全带”。平时感觉不到它,但真出问题的时候,它是唯一能拦住”一个识别错误导致一笔错误扣款”的东西。能办事的系统越强,这条安全带就越不能少。

三层串起来,看看完整的样子

第一层·意图编排 Agent——用户输入进来,先判断:是”问问题”还是”要办事”?是问→进检索层;是办→交给任务执行 Agent。

第二层·任务执行 Agent——匹配对应的 Skill,提取参数(充多少、退哪个单),准备执行。

第三层·合规校验 Agent——执行前踩一脚刹车:合规吗?参数对吗?要不要人工确认?涉及钱和合规的,过审才放行;高风险的,拉人进来拍板。

而且这几层经常连着走。客户问”我话费怎么欠了40″——意图编排判断是”问”,走图谱/RAG 查出账单组成答出来;系统答完顺势接一句”需要帮您充值吗”——客户说”充50″,意图编排这次判断是”办”,任务执行 Agent 匹配充话费 Skill,合规校验确认金额和账户,单点登录完成充值。一次对话里,“答”和“办”无缝衔接,这才是好体验。

多了一个不能忽略的维度:风险

上一篇说选检索方式要看效果、成本、延迟、可维护性。到了”会办事”这一层,要再加一个最重要的维度——风险

几个最直白的对比:”怎么交话费”→走普通 RAG,这是”问”;”帮我充50话费”→走 Skill,这是”办”,执行前必须过合规校验;”你好”→一句话打发,别浪费任何资源。

结语

把问题”答对”,只是一个问答系统的起点;能把事”办成、办稳”,才是它真正的价值所在。

这三层各司其职,缺了哪层体验都会差一截:意图编排分不清”问”和”办”,后面全乱;任务执行层缺失,系统永远停在”会说不会做”;合规校验不做,办事能力越强风险越大。

该答的答好,该办的办成,碰到钱和合规,加入人工审核。三层齐了,才能真正把客服Agent做好。

本文由 @是AD 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自 unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!