当前位置：首页 > news >正文

从工单到回复：Claude API 在客服工单总结中的应用

news 2026/6/25 18:16:10

为什么客服工单需要 Claude API

客服工单真正麻烦的地方，往往不是没人回复，而是信息太散、处理太慢，而且不同坐席的回复口径还容易不一致。一条看似普通的工单，里面可能同时包含客户背景、历史沟通、订单信息、情绪表达，还有几轮追问。人工坐席通常要先把这些内容读完，再提炼重点，判断优先级，最后组织一段合适的回复。这个过程很重复，也很耗时间。尤其是当在线客服、邮件、电话、App 反馈等多个渠道都接进来以后，工单量一上来，首响变慢、摘要质量不稳定、回复风格不统一的问题就会很明显。

Claude API 的价值，正好体现在“理解”和“生成”这两个环节。它可以把一大段历史对话压缩成结构化摘要，提取出客户诉求、情绪状态、紧急程度以及还缺哪些信息；也可以结合工单摘要和知识库内容，生成更接近真实客服语气的回复草稿。简单说，工单系统继续负责流程，Claude API 则补上智能处理这一层。

Claude API 在工单处理链路中的位置

如果把客服工单的处理过程拆开，一条比较自然的链路大概是这样：

客户消息/邮件/电话转写 → 工单系统创建工单 → 数据清洗与脱敏 → Claude 生成结构化摘要 → 分类、优先级、情绪识别 → 检索知识库/订单状态 → Claude 生成回复草稿 → 规则校验/人工审核 → 自动回复或转人工 → 写回工单系统

这里需要特别说明一点：Claude API 并不是要替代整个客服系统。工单创建、状态流转、SLA、权限管理、消息发送这些能力，仍然应该由原来的工单系统来负责。Claude API 更适合处理长文本理解、内容总结、回复草稿生成和辅助质检。这样拆开之后，既不会打乱原有业务流程，也能把大量重复阅读和初步整理的工作交给模型先处理。

第一步：把原始工单整理成 Claude 可处理的输入

模型效果好不好，很多时候不只取决于 Prompt，输入内容本身也很关键。客服工单的来源通常比较杂，可能是在线聊天、邮件、电话 ASR 转写、App 反馈、IM 会话，也可能混着历史处理备注。如果直接把这些内容原封不动丢给模型，很容易出现重复信息太多、噪声太多、上下文过长等问题，最后输出也会变得不稳定。

实际接入时，建议先做几件基础处理。比如去掉 HTML、系统通知、邮件签名档和重复引用；把同一工单里的多轮消息按时间顺序合并起来；再对手机号、地址、身份证、银行卡等敏感信息做脱敏。订单号、手机号后四位这类信息可以适当保留一部分，方便后续和业务系统做关联。

输入越干净，Claude API 的输出通常就越稳定。尤其是在做客服工单总结时，最好把“客户说了什么”和“系统里已有的数据”分开传给模型，这样能减少模型把两类信息混在一起的概率。

第二步：用 Claude 做客服工单总结

很多团队说要做“自动总结”，最后其实只是把工单压缩成一小段话。这样当然有用，但在生产环境里还不够。更实用的方式，是让 Claude 输出结构化字段，这样后面做工单分流、优先级判断、知识库检索和自动回复都会方便很多。

下面是一个比较典型的客服工单总结输出：

{ "summary": "客户反馈订单三天未发货，多次联系未得到明确回复，要求退款并表示可能投诉。", "customer_intent": "催发货/退款/投诉", "issue_category": "物流发货", "priority": "high", "sentiment": "angry", "key_facts": [ "订单已下单三天", "客户认为客服响应不及时", "客户要求退款", "客户有投诉倾向" ], "missing_info": [ "订单号", "当前物流状态", "是否超过承诺发货时间" ], "recommended_action": "先核实订单状态；如未发货，优先解释原因并给出退款或加急处理方案。", "need_human_review": true }

这种结构化摘要比单纯的一段自然语言总结更适合落地。它可以直接用于工单分流、优先级判断，也能作为后续生成回复草稿的输入。另外，结构化字段也方便后面做数据统计，比如哪些问题最多、哪些类型最容易升级、哪些工单需要更多人工介入。

工单总结 Prompt 的关键点

总结类 Prompt 不建议让模型随意发挥，而是要把边界说清楚。比如，要求模型只能基于输入内容回答，不能补充外部假设；输出必须是固定 JSON；客户诉求、情绪、缺失信息都要保留；无法确认的内容标记为空或未知；一旦涉及高风险场景，就直接标记为需要人工复核。

这些约束看起来有点细，但在客服场景里非常必要。因为只要一个事实写错，后面的回复就可能跟着跑偏，甚至引发新的投诉。

第三步：基于摘要生成 AI 工单自动回复

客服自动回复里最容易踩坑的一种做法，是直接把原始工单交给模型，然后让它“写一段回复”。这样看起来简单，实际风险不小：回复口径可能不稳定，模型可能编造政策，内容可能太长，语气也未必符合品牌要求。

更稳的方式是先总结，再回复。也就是说，把 Claude 的输入拆成三部分：工单摘要、知识库命中的内容，以及订单状态或其他业务系统数据。然后再让模型基于这些信息生成回复草稿。

这样生成出来的 AI 工单自动回复，就不是“凭感觉写一段”，而是尽量建立在事实和规则之上。

自动回复 Prompt 应该关注什么

一个好用的回复 Prompt，至少要把几个要求讲清楚。回复要简洁、礼貌、明确；不能承诺尚未确认的退款、赔付或处理时间；不能编造物流状态、库存状态或政策内容；要先安抚客户情绪，再说明接下来的处理动作。如果当前信息不够，就主动要求客户补充订单号、手机号后四位等必要字段。遇到高风险情况时，则直接输出“建议转人工”。

比如回复可以写成这样：

很抱歉让您久等了。我已看到您反馈的是订单发货延迟和退款诉求。我们会先核实当前订单状态，如果确认尚未发出，会尽快为您提供退款或加急处理方案。为了加快处理，请您补充订单号或下单手机号后四位。

这种表达比生硬的模板更自然，也更符合中文客服里常见的沟通方式。

什么时候可以自动发送，什么时候必须转人工

AI 工单自动回复并不是生成出来就能直接发给客户。真正上线时，必须先把边界定义清楚。

工单类型	是否自动发送	处理建议
普通 FAQ	可以	直接回复
查询进度	可以，但需接系统数据	回复真实状态
退款申请	不建议直接自动发送	生成人工草稿
投诉升级	必须人工审核	标记高优先级
法律/监管相关	必须人工处理	触发升级流程
知识库无匹配	不自动回复	转人工

一个比较实用的原则是：只要涉及赔偿、退款承诺、法律表述、敏感投诉，就默认不要自动发送。Claude API 可以先帮坐席生成草稿，但最终能不能发，仍然要受规则和人工审核控制。

Claude API 调用示例：从工单文本到结构化摘要

下面用常见的消息接口思路做一个简化示例，重点看调用方式和输出控制。

import json from anthropic import Anthropic client = Anthropic(api_key="YOUR_API_KEY") system_prompt = """ 你是客服工单总结助手。请只基于输入内容输出JSON，不要添加解释。 必须包含 summary、customer_intent、issue_category、priority、sentiment、 key_facts、missing_info、recommended_action、need_human_review。 """ user_prompt = """ 工单内容： 客户反馈订单三天未发货，多次联系客服未得到明确答复，要求退款并表示将投诉。 历史备注：暂无。 """ resp = client.messages.create( model="claude-3-5-sonnet-latest", max_tokens=800, temperature=0, system=system_prompt, messages=[{"role": "user", "content": user_prompt}] ) text = resp.content[0].text data = json.loads(text) print(data)

实际落地时，可以把模型名称换成你当前可用的 Claude 兼容模型，具体还是以平台最新说明为准。如果团队需要中文支持、企业充值、开票或基础技术协助，也可以优先考虑兼容接入能力更完整的平台，这样后续运维会省心一些。

一个完整示例：工单如何被总结并生成回复

假设有这样一条工单：

用户反馈订单已下单三天还没发货，联系客服两次都没得到明确答复，希望尽快退款，否则会投诉。

用 Claude API 先做总结，可能会得到这样的结果：

{ "summary": "客户投诉订单三天未发货，曾多次联系客服但未获得明确答复，当前诉求是退款，并有投诉倾向。", "customer_intent": "退款/投诉/催发货", "issue_category": "物流发货", "priority": "high", "sentiment": "angry", "key_facts": [ "订单已等待三天", "客户已联系过客服两次", "客户要求退款", "客户有投诉意向" ], "missing_info": [ "订单号", "是否超过承诺发货时间", "当前仓库/物流状态" ], "recommended_action": "先核实订单状态；如未发货，优先说明原因并给出退款或加急处理选项。", "need_human_review": true }

接下来，系统可以从知识库里检索“发货延迟处理规则”“退款说明”“加急发货流程”等内容，再把这些信息交给 Claude 生成回复草稿。最终呈现在坐席面前的，就不再是一大段原始聊天记录，而是“摘要 + 建议动作 + 回复草稿 + 风险提示”。这比单纯做摘要更接近真实客服业务，也更容易被团队真正用起来。

如何降低 Claude API 成本和延迟

客服场景通常不是少量高价值请求，而是大量重复请求，所以成本和延迟都要提前考虑。

常见的做法包括：短工单优先使用轻量模型；长工单先分段压缩，再做最终总结；历史对话只传最近几轮和已有摘要；重复问题尽量使用知识库缓存；低价值工单可以批处理，不一定每条都实时调用；只有高风险工单才追加一次质检；结构化摘要也要保存下来，避免后续反复读取全文。

如果前端或工单系统已经能判断某个问题属于 FAQ 或标准查询，其实可以先走规则引擎。只有规则覆盖不了的时候，再调用 Claude API。这样通常更稳，成本也更可控。

上线前必须做的安全与质检

客服自动化最怕的不是回复慢，而是回复错。进入生产环境前，安全和质检一定要补上。

比如，要对 PII 做脱敏；对退款、赔付、法律承诺这类内容设置黑名单词或规则拦截；对情绪激烈、投诉升级类工单强制人工审核；知识库没有命中的问题不要自动发送；模型输出要做 JSON 校验和业务规则校验；人工修改过的内容也要记录下来，用来反哺 Prompt 和知识库。上线时最好采用灰度发布和 A/B 测试，先在小范围里验证效果。

一句话概括，Claude API 很适合做“理解和草拟”，但最终的业务责任还是要由规则和人工来兜底。