PaperAgent
Agent-in-the-Loop: A Data Flywheel for Continuous Improvement in LLM-based Customer Support
实现了一个持续的数据飞轮,用于迭代改进基于 LLM 的客户支持系统。将四种关键类型的标注直接集成到实时客户运营中,这些反馈信号无缝反馈至模型更新中。
Loading...
实现了一个持续的数据飞轮,用于迭代改进基于 LLM 的客户支持系统。将四种关键类型的标注直接集成到实时客户运营中,这些反馈信号无缝反馈至模型更新中。

客户输入:客户发送查询或消息。
基于 LLM 的交互系统:系统首先从“统一知识库”中检索相关知识。该知识库整合了客户指南、常见问题解答、内部政策、动态上下文和历史案例等资源。随后,系统使用 LLM 生成回复候选。
建议回复:系统会向客服人员(Agent)展示两个备选回复,这两个回复可能生成自不同的模型。
客服标注(Agent Annotation):客服人员在为客户提供服务的同时,对系统提供的建议进行实时评估,具体包括四步标注:
审核标注:由人类专家和基于 LLM 的验证器共同审核客服的标注与实际对话交互,以标记其中可能存在的冲突。
持续学习管道:收集到的标注和反馈会被自动化地重新整合到模型的训练管道中(这里优化的是RAG中的检索,重排和生成模型)。这一阶段主要包括:
通过这一整套基于真实交互场景的在线反馈和自动训练管道,该方法成功地将模型更新周期从几个月缩短到了几周。