通过预先训练和微调的 LLM 提高呼叫中心的效率
快速阅读: 据《芬格尔》最新报道,本文介绍了一种工具方案,通过自动化评估通话质量提升呼叫中心效率,解决高流失率、高通话量等问题。该方案利用AI模型评估通话,提供可解释的反馈,并可通过微调适应不同需求,实现全球可扩展性。
许多面向客户的公司面临呼叫中心效率的重大挑战。最常见的问题包括:高员工流失率:呼叫中心专家频繁离职促使公司不断优化招聘、培训和评估呼叫中心员工的政策。高通话量:大量来电导致无法监控每一次互动,难以确保公司服务质量标准不被违反。多国和双语运营:在不同国家运营呼叫中心或管理双语中心的公司难以在不同语言间提供一致的服务质量。
如何应对
为了解决这些挑战,这里提出了一种工具方案,可以自动估算通话质量和从0到1的评分。这种方法允许:
主管:专注于有问题的通话并与团队合作解决已识别的问题。
管理层:方便且可追溯地查看呼叫中心效率的概要。
快速响应问题:通过红色警报标记通话内容,实现及时响应。
代理激励:通话分数可用于激励代理。
解决方案引入标准
为了提升结果的可解释性并减少评估中的主观性,所提出的工具根据预定义的标准评估通话质量。每个标准在整体通话质量评估中都有相应权重。这些标准可由呼叫中心主管、运营或市场专家以及参与设计呼叫脚本的员工制定。
示例:假设专家指定,在通话期间,员工应:
– 介绍自己并提及公司的名称。
– 说明通话目的。
– 回答客户的所有问题。
– 至少提供一个交叉销售(即建议额外的产品)。
– 避免使用粗俗语言。
每个标准都可以分配特定的分数和/或标记为红色警告。在这个例子中,前四个标准的权重分别为(0.2、0.2、0.2、0.4),而使用粗俗语言作为红色警告。每次通话都根据分配的权重进行评分。总分引导主管关注特定的通话,特别是那些得分低或触发红色警告的通话。此外,员工的平均分数可以作为激励工具,整个呼叫中心的平均分数可以为高层管理者提供清晰的绩效指标。
这种方法的好处:
– 高度可适应:标准列表可以轻松修改而不改变整体人工智能解决方案架构。
– 专注于改进:它清楚地指出了每个呼叫中心专家需要改进的服务方面,为主管提供了有针对性的培训工具。
– 可解释:系统对为什么通话被评为低质量或高质量提供了明确的解释。
通用解决方案架构
解决方案概述:
通用解决方案架构的第一部分是定期(例如每天一次)的批量推理通话记录。这部分处理通话并存储处理结果。
批量推理包括三个步骤:
– 转录:语音识别模型创建通话记录的转录。
– 翻译:使用翻译模型将转录翻译成英文。(如果通话记录已经是英文,则可以跳过此步骤。此外,一些模型,如OpenAI的Whisper,可以生成英文转录,无论原始语言是什么。)
– 标准估算:将翻译后的文本输入标准估算模型。
通话处理结果存储在数据库中。总体有效性指标汇总到管理报告,使管理层能够方便且可追溯地查看整体呼叫中心的有效性和性能。详细估算显示给主管,他们可以根据性能、特定标准或红色警告过滤通话,并采取措施提高个别员工的服务质量。在此步骤中,主管可以手动更改通话估值结果;这些更改作为主管反馈存储在数据库中。
从主管处收到的反馈用于对模型进行微调,确保在收到新反馈时持续更新。
可以手动更改通话估值结果;这些更改作为主管反馈存储在数据库中。
此解决方案的好处:
– 基于标准的估算:该解决方案采用预定义的标准进行估算,提供增强的可解释性、减少主观性、可行的见解等好处。
– 全球可扩展性:它可以以最小的适应性同时部署到多个国家和地区。
– 模块化设计:解决方案的每个组件独立运行,允许针对性的培训和改进。
通话转录
在本解决方案中使用了Whisper进行通话转录;但是,如果其他更适合的语音到文本模型能更好地满足特定案例需求,则可以集成。
Whisper的优点:
– 多语言支持:Whisper支持多种语言,使解决方案能够轻松适应新语言,而无需进行重大修改。
– 开源且免费:作为开源软件,Whisper免费使用,降低整体成本。
– 高性能:Whisper在转录任务中表现相对较高。
有关其性能指标的更多详细信息,请参阅官方Whisper存储库及相关文档。
通话翻译
在本解决方案中,Whisper也用于通话翻译;但是,如果其他翻译模型更好地满足特定案例需求,则可以集成。
Whisper用于翻译的优势:
– 广泛支持的语言范围:Whisper支持多种源语言,并且可以以英语生成转录,无论原始语言是什么。
– 开源且免费:作为开源软件,Whisper免费使用,使其成为一种经济实惠的选择。
– 上下文准确性:Whisper擅长捕捉对话的整体含义,而不是逐字逐句翻译,从而产生更自然和准确的翻译。
标准估算(初步近似)
如果你缺乏依据你的标准进行评分的广泛数据(这通常是这种情况),初始的标准估算方法可以通过广泛可用的预训练LLM之一来完成。这些模型可以评估用普通语言表述的标准,提供估算值,形成数据集。或者,如果不需微调或时间和精力的成本超过收益,可以直接使用这些估算值。
在本解决方案中,Llama 3.2用于初步近似。然而,如果其他预训练LLM更好地满足你的具体要求,也可以使用。
Llama的优点:
– 开源且免费:Llama是开源的,使其易于获取且具有成本效益。
– 高性能:它在总结对话和处理非结构化文本方面表现出色,这对于有效的标准估算至关重要。
反馈回路工具
为了向主管提供详细的结果并收集关于模型结果的人类反馈,该解决方案包含一个专门的反馈回路工具。
反馈回路工具主要功能:
– 突出显示有质量问题或红色警告的通话:该工具允许主管快速识别专家表现不专业的通话,从而迅速采取行动。
– 通话质量的深入洞察:它提供了通话中出错情况的全面、客观的总结,帮助主管向专家传达具体问题。
– 反馈收集:用户可以在所有阶段(包括转录、翻译和标准估算)提交关于模型准确性的反馈。
此工具可以根据每个实施案例的具体要求开发为不同程度的复杂性。
微调标准估算模型(第二次近似)
从主管处收集的反馈用于对模型进行微调,以提高标准估算的准确性。微调过程集成到CI/CD管道中,确保在收到新反馈时持续更新。
LoRA(低秩适应)方法用于此微调任务。
LoRA方法的优点:
– 资源效率:LoRA在微调过程中需要更新的参数较少,减少了计算开销并加快了训练过程。
– 改进泛化:通过专注于低秩修改,LoRA最小化了过拟合的风险,使微调后的模型能够更好地在各种通话场景中实现泛化,并有效适应新数据。
总结
本文所述的工具在改善联络中心质量方面已被证明是有效的,展示了适用于各种呼叫中心任务的通用方法——例如电话销售、债务催收等。其模块化和可扩展的架构使组织能够轻松将解决方案扩展到多个国家和地区,同时适应不同的运营需求。
(以上内容均由Ai生成)