多标签分类预测技能型呼叫路由

多标签分类优化呼叫路由
部署运行你感兴趣的模型镜像

基于多标签分类技术的预测性技能型呼叫路由

摘要

本文针对坐席人员具备异构技能集的呼叫中心场景。此类呼叫中心面临的一个重大挑战是基于技能的通话路由:即将呼入的客户通话匹配至具备相应技能集的呼叫中心客服代表。本文将提出一种替代传统基于交互式语音应答(IVR)菜单的技能导向通话路由方法。本文还将采用多标签分类技术,提前预测客户通话目的,并在无需客户干预的情况下将其路由至合适的呼叫中心坐席人员。这种免打扰的通话路由方法可实现高效的互动,有助于提升客户体验,从而提高客户满意度并创造更好的交叉销售机会。

关键词
Het异构技能集,多标签分类,预测分析,基于技能的呼叫路由

引言

现代服务行业见证了向客户提供服务的多样性呈指数级增长(德勤,2015)。这种不断扩大的多样化因行业内部激烈的竞争而变得更加复杂。竞争迫使服务公司竭尽全力建立有效的客户关系,并致力于提供高质量的客户体验。在此过程中,公司的客户服务人员,即一线员工,在决定客户对服务整体评价方面发挥着重要作用(Fitzsimmons & Fitzsimmons,2006)。因此,服务公司投入大量精力,力求确保拥有合格、训练有素且具备技能的客户联系人员。

理想情况下,一家公司希望其客户联系人员能够熟练处理所有可能的客户需求。然而,由于复杂性、多样性以及可提供服务数量的激增,这一目标已变得不可行。客户联系人员通常会专注于与客户相关的有限活动范围,这有助于他们集中精力并在特定类别的通话和服务请求中发展专业知识,而不是分散精力应对大量可能的活动。这种现象在金融服务等行业中尤为普遍,因为客户通常具备有限的金融知识,而联系人员在引导客户方面发挥着重要作用。在这种情况下,联系人员的技能组合灵活性非常有限,更接近于所谓的呼叫中心完全专业化(FD)架构(Legros, Jouini, & Dallery, 2015)。

呼叫中心的服务质量取决于客户等待接受服务的时间(也称为服务流程)以及客户对所获得信息和服务价值的认可程度(也称为服务结果)(Akşin, Armony, & Mehrotra, 2007)。然而,联系人员技能组合的异质性直接影响到这两方面的服务质量。在典型的金融服务呼叫中心中,客户通常需要通过交互式语音应答(IVR)系统从一长串可能的服务请求中进行选择。使用IVR系统会直接增加获取服务所需的时间。此外,部分客户无法充分判断其服务请求所需的技能组合,这可能导致错误的选择,或仅选择能使其直接与呼叫中心客服代表通话的选项。其结果是客户要么未能获得必要的信息,要么被重新路由到具备相关技能组合的坐席人员,从而导致等待时间更长。这些情况都会引发客户的挫败感、不满情绪,最终可能导致客户放弃通话,造成服务质量下降。最后,近年来,呼叫中心的互动越来越多地被用作向客户进行交叉销售/追加销售其他相关产品的机会(Rongala, 2015)。在一次低质量服务体验之后立即进行交叉销售推介,可能会适得其反,进一步加重客户的不满。

服务具有异质性和可变性。每位到达的客户对服务都有其独特的期望,并具备不同的能力,这需要客户服务人员采取差异化的处理方式。客户类型的不可预测性是服务领域的主要挑战,有效应对这种不确定性对于企业建立可持续的竞争优势至关重要。如今,企业能够通过社交媒体、网页点击流、文本数据及其他接触点以前所未有的方式获取客户数据,这些数据为了解客户需求和行为提供了丰富的信息来源。近期预测分析技术的进步使企业能够生成非常强大的洞察,以帮助提升客户体验。在本研究中,我们利用一类名为多标签分类技术(佐马卡斯 & 卡塔基斯, 2007)的预测分析方法,应用于一个金融服务通话中心的情境中。

我们工作的关键目标是提高客户的服务流程质量以及服务结果,同时增强交叉销售机会。我们的方法论利用现有的结构化和非结构化客户信息,提前预测通话目的,并将其直接路由到具备相应技能的客服代表。我们使用现有呼叫中心的历史数据评估了各种可用的多标签分类技术,并选择最适合我们数据的一种。此外,我们展示了该系统部署后对呼叫中心绩效指标的影响。

接下来,我们回顾相关文献,并将本文置于此前相关工作的背景下进行定位。然后,我们介绍为获得最适合现有客户数据的多标签分类技术所采用的方法论。最后,我们总结了研究的局限性以及未来研究的方向。

文献综述

呼叫中心运营管理层一直是涵盖通话预测、人员招聘、人员配置、排班、通话路由和呼叫中心绩效评估等各个子领域的研究热点(Akşin, Armony, & Mehrotra, 2007)。将异构的技能组合纳入劳动力规划也是以往研究中的一个关注主题。De Bruecker 等人(2015)对涉及技能的劳动力规划问题的相关文献进行了全面回顾和分类。我们将本文定位在 De Bruecker 等人的分类体系中如下:本文的应用领域属于呼叫中心范畴,其中个体任务的类别化技能由技术知识/能力水平决定,并能带来更高质量的服务。任务的灵活性有限,主要关注的是技能专业化而非灵活性,技能是我们在最大化服务质量这一问题中的约束条件之一。技能池被假定为静态的,即不考虑客服代表的流动。该问题本质上是随机的,所接收的通话类型具有不确定性。我们采用实时多标签分类技术,并在真实数据上运行计算测试。在此背景下,本文主要关注基于技能的通话路由。

传统上,处理基于技能的通话路由问题的文献主要研究如何通过具备互补技能组合的客服代表网络,将通话最优地路由至能够成功解决该通话需求的坐席人员(Wallace & Whitt, 2005)。这一优化问题因客服代表效率的异质性、客服代表之间的相互依赖性、客服代表偏好以及基于通话类别的优先级规则而变得更加复杂。为此,已采用从线性规划和仿真优化(Cezik & L’Ecuyer, 2008)、扩散或流体近似方法(Whitt, 2006; Whitt, 2004)到损失系统近似方法(Ormeci, Burnetas, & Emmons., 2002)等多种方法(Akşin, Armony, & Mehrotra, 2007)。近年来,文献更多关注基于技能的通话路由问题与人员配置问题及灵活性设计问题之间的层级依赖关系(Legros, Jouini, & Dallery, 2015;Akşin, Çakan, Karaesmen, & Örmeci, 2015)。

显然,以往的研究主要从优化的角度来处理基于技能的路由问题,且所有这些论文均将通话目的或通话类型视为给定且已知的信息。

然而,由于前述原因,通话目的并不总是明确或存在不确定性,使用IVR系统会降低服务质量。这成为任何拟议优化解决方案成功实施的主要障碍,尤其是在所需技能数量可能非常多的金融服务行业。因此,提前知晓通话目的是一项关键信息,可大幅提高服务质量。

因此,无需使用IVR系统的呼叫中心通话分类创新方法也受到了广泛关注。自然语言处理与机器学习算法已被用于此目的(Ali, 2011)。呼叫者需口述通话目的,系统将音频转录并挖掘数据,以构建一个用于对客户未来通话目的进行分类的学习系统(Tang, Pellom, & Hacioglu, 2003; Hakkani‐Tur, Tur, Rahim, & Riccardi, 2004)。然而,语音识别系统存在一些缺点。除了成本较高之外,其可靠性也较低,文献中已有很多研究聚焦于克服该通话分类方法所面临的各种挑战(Tarjan, Sarosi, Fegyo, & Mihajlik, 2013)。尽管已有上述研究,语音识别仍具有侵入性,容易出现与IVR通话分类系统类似的错误。此外,自然语言处理方法过度强调通话转录文本的使用,未能充分利用呼叫中心可获取的其他客户相关数据。

在本文中,我们提出了一种替代昂贵且复杂的自然语言处理系统的方案。我们并未使用通话转录文本,而是利用历史客户互动及其他信息来进行通话分类。随着技术的进步,企业的数据捕获能力已大幅提升。如今,企业能够从社交媒体、网页点击流和文本数据中捕获并挖掘客户数据,用于各种目的。社交媒体和网站数据挖掘为客户请求提供了丰富的信息来源。客户与组织在近期的互动可能有助于预测未来的服务请求。我们的方法在保持节俭的同时也具有成本效益,这一点将在下一节的方法论中得到证明。

方法论

当一个客户拨打一个通话中心时,同一通电话可能有多个目的;例如,重置密码和咨询某个新产品等。每种请求类型都关联有一个通话标签,我们将其定义为 $ C \in {C_1, C_2, …, C_L} $。此外,我们可获取该客户在本次通话前的所有历史特征信息,我们将其定义为 $ X \in {X_1, …, X_M} $。

我们方法论的主要目标是利用结构化和非结构化的历史客户信息来预测客户通话的目的。换句话说,此处的目标是计算 $ P(C|X_i) $,即在给定历史信息的情况下某通电话具有某种目的的概率。这使其适用于多类多标签分类问题的框架(Hakkani‐Tur, Tur, Rahim, & Riccardi, 2004)。我们所使用的多标签分类系统的输入是通话前的历史特征信息,输出是目的标签,表明客户为何拨打服务中心。该预测出的通话目的随后被用于将通话路由到具备相关技能集的客服代表。

通话标签集 C 可以是技能需求的形式,也可以是通话目的的形式,并结合预先确定的目的‐技能映射。图1描述了这两种方法。由于标签总数对多标签分类算法的性能有显著影响,因此选择使用哪种方法可基于以下两者中数值较高的一个:通话目的总数或技能需求总数。根据这一准则,本文工作采用第一种方法。通话目的到客服代表技能集的映射是根据与呼叫中心管理层协商的业务知识完成的。

示意图0

数据收集

我们基于技能的通话路由方法在一家金融服务呼叫中心进行了试点。在当前分析中,从该呼叫中心每年接收的大约50万通电话中随机选取了3万通电话,占总体的6%。所考虑的通话时间段为2015年3月到2016年2月。样本采用按月份分层的随机抽样方法选取,以尽量减少季节性效应的影响。

为每次通话获取标签是数据收集过程中最困难的部分。经过高度培训且经验丰富的坐席人员听取了通话内容,并为每次通话添加标签。样本中客户来电的目的约有120种不同情况。这120种通话目的被归类到12种处理该通话所需的技能类型。通话类型与技能类型的映射是在与呼叫中心管理层协商后确定的。

每次通话都关联一个客户ID以及一个或多个与通话目的相关的标签。由于通话可能具有多个目的,因此允许对通话进行多标签标注。记录唯一的客户ID有助于跟踪后续的任何跟进通话。此外,还收集了在收到通话之前的历史客户相关信息。这些信息包括人口统计信息、产品信息、投诉、对营销活动的响应、交易、互动、他们的社交媒体活动等。

示意图1

数据分析

收集的数据被按65:35的比例划分为开发数据集和一个验证数据集。为了对一个特定实例进行预测和验证,将为每个类别的后验概率设置一个阈值,该阈值内的类别将被包含在预测的标签集中。为了确定最优阈值,开发数据集进一步被划分为70:30的两部分。选择在30%的数据上使F1分数(下文讨论)最大化的阈值,然后将其用于对验证数据集的预测。

多标签转换主要有两种方法:问题转换和算法适应。图3展示了我们在此论文中考虑的各种方法。

示意图2

性能评估和洞察

多标签分类问题中的性能评估与传统分类不同,传统分类中只有两种选择1和0,即匹配或不匹配。由于多标签分类的输出是一个标签集而非唯一类别,因此可能存在部分匹配的情况,故有多标签模型评估的两类不同指标:基于样本和基于标签的指标(张和周(2014)):
- 基于实例的指标 通过验证数据集中的每个实例来评估分类器的性能,最终值通过对整个数据集进行平均得到。对于上述各项指标,分数越高表示性能越好,但汉明损失(hamming loss)除外;
- 基于标签的指标 计算分类器对每个单独标签的性能,然后通过对标签集中所有可能的标签进行两种类型的平均(微观/宏观)得到最终值。

我们采用基于样本的指标,因为我们关注的是分类器对每次通话的表现,而非聚合结果。基于标签的分类器方法的性能列在附录中。每种多标签分类技术的性能均在验证集上使用以下指标进行评估:hamming loss、准确率、精确率、subset accuracy、召回率和 F1分数。

如果 $ h(x_i) $ 是预测的标签集,$ Y_i $ 是实例 $ i $ 的实际标签集,而 $ |A| $ 表示集合 A 的基数。此外,对于多标签分类问题中标签 j 的真正例、真负例、假正例和假负例如下定义:

$$ TP_j = |{x_i : y_j \in Y_i \land y_j \in h(x_i)}|, \quad 1 \leq i \leq p $$
$$ FP_j = |{x_i : y_j \notin Y_i \land y_j \in h(x_i)}|, \quad 1 \leq i \leq p $$
$$ TN_j = |{x_i : y_j \notin Y_i \land y_j \notin h(x_i)}|, \quad 1 \leq i \leq p $$
$$ FN_j = |{x_i : y_j \in Y_i \land y_j \notin h(x_i)}|, \quad 1 \leq i \leq p $$

各种指标定义如下:

$$ \text{Accuracy} = \frac{1}{p} \sum_{i=1}^{p} \frac{|h(x_i) \cap Y_i|}{|h(x_i) \cup Y_i|} $$

$$ \text{Precision} = \frac{1}{p} \sum_{i=1}^{p} \frac{|h(x_i) \cap Y_i|}{|h(x_i)|} $$

$$ \text{Recall} = \frac{1}{p} \sum_{i=1}^{p} \frac{|h(x_i) \cap Y_i|}{|Y_i|} $$

$$ \text{Subset Accuracy} = \frac{1}{p} \sum_{i=1}^{p} \mathbb{I}(h(x_i) = Y_i) $$

$$ \text{Hamming Loss} = \frac{1}{p} \sum_{i=1}^{p} \frac{|h(x_i) \Delta Y_i|}{|L|} $$

$$ \text{F1 Score} = \frac{2 \times \text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} $$

对于所有上述指标,除了汉明损失(hamming loss)应越低越好外,其他每个指标的得分越高,表示性能越好。对于所考虑的数据集,我们评估了这些基于性能的指标中的每一项。所有指标均已绘制在图4中,并确定了最佳的多标签分类方法。

就子集准确率而言,标签幂集方法的表现优于所有其他方法,而在标签幂集方法中,多项式逻辑斯蒂回归给出了最高的子集准确率。二进制相关性方法的结果非常差,这可能是由于其假设标签相互独立,因此通过聚合多个二进制分类器的预测结果所形成的预测标签集与大多数实例的实际标签集差异较大。

就汉明损失而言,结果与子集准确率相似,即标签幂集方法优于其他方法,且多项式逻辑斯蒂回归在标签幂集方法中表现最佳。

使用准确率和精确率,标签集方法在性能上略优于数据转换方法,在这两种方法中,多项式逻辑斯蒂回归给出了最高的得分。在数据转换方法下,多类支持向量机在这两项指标上的表现较差,原因是需要对参数进行适当的调优,而这只能通过试错实现,并且因数据集而异。

使用召回率,对应用数据转换方法后的数据集采用多项式逻辑斯蒂回归,在算法适应、标签幂集和二进制相关性方法上明显优于所有分类算法,并略微优于数据转换方法下的 AdaBoost算法以及二进制相关性方法下的随机森林算法。

就作为精确率和召回率调和平均数的F1分数指标而言,我们观察到数据转换方法的表现也优于其他方法,且多项式逻辑斯蒂回归相较于AdaBoost算法略胜一筹。

根据结果,针对我们的特定数据集,我们关注精确率指标,因为我们希望以高置信度分类通话目的,而不仅仅是在预测标签集中尽可能多地捕捉实际的通话目的。基于所选的评估指标,采用标签幂集方法的多项式逻辑斯蒂回归显著优于其他方法,取得了最佳结果。因此,我们选择此方法作为对通话进行分类的主要方法论。

影响评估

多标签预测模型与另外两个基于技能的通话路由系统进行了比较:使用交互式语音应答系统进行路由的通话,以及使用内部语音语句识别系统进行路由的通话。每一次呼入通话都基于多标签呼入通话目的的可能性得分进行评估分类系统。当入站通话目的的概率超过阈值时,将根据分析结果直接路由到相应的呼叫中心客服代表。当目的不明确时,即目的的阈值概率低于阈值,则随机使用语音语句系统或交互式语音应答系统。该方法在一个金融服务中心进行了为期三个月的实际应用。近26%的通话最终通过多标签分类系统进行路由。

考虑了三个指标来评估每个模型的性能:转接率(接听后不得不转接到其他坐席人员的通话百分比)和客户满意度指数(通过独立调查测量)。一项客户满意度调查显示,在通话被路由到客服代表的客户中,客户满意度高出2个点(满分100分)。

示意图3

多标签分类预测系统的通话转接率为5.2%,而交互式语音应答系统的转接率为8%。语音语句识别系统的转接率最佳,为4.5%。总体而言,基于多标签分类的预测性技能路由系统表现几乎与语音语句识别系统相当,成本却仅为后者的一小部分,同时提供了略高的客户满意度。

结论

本文中,我们 unconventional 地使用多标签分类技术来预测呼叫中心收到的通话意图,并将其路由到合适的客服代表。我们阐明了为我们的数据找到合适多标签分类技术所遵循的过程,并最终提供了一些在实际金融服务呼叫中心实施该技术的结果。本文的主要目的是对基于技能的通话路由文献做出贡献,超越优化领域,并为潜在的呼叫中心管理者在实施此技术过程中提供一条可行路径。

您可能感兴趣的与本文相关的镜像

Qwen3-8B

Qwen3-8B

文本生成
Qwen3

Qwen3 是 Qwen 系列中的最新一代大型语言模型,提供了一整套密集型和专家混合(MoE)模型。基于广泛的训练,Qwen3 在推理、指令执行、代理能力和多语言支持方面取得了突破性进展

【最优潮流】直流最优潮流(OPF)课设(Matlab代码实现)内容概要:本文档主要围绕“直流最优潮流(OPF)课设”的Matlab代码实现展开,属于电力系统优化领域的教学与科研实践内容。文档介绍了通过Matlab进行电力系统最优潮流计算的基本原理与编程实现方法,重点聚焦于直流最优潮流模型的构建与求解过程,适用于课程设计或科研入门实践。文中提及使用YALMIP等优化工具包进行建模,并提供了相关资源下载链接,便于读者复现与学习。此外,文档还列举了大量与电力系统、智能优化算法、机器学习、路径规划等相关的Matlab仿真案例,体现出其服务于科研仿真辅导的综合性平台性质。; 适合人群:电气工程、自动化、电力系统及相关专业的本科生、研究生,以及从事电力系统优化、智能算法应用研究的科研人员。; 使用场景及目标:①掌握直流最优潮流的基本原理与Matlab实现方法;②完成课程设计或科研项目中的电力系统优化任务;③借助提供的丰富案例资源,拓展在智能优化、状态估计、微电网调度等方向的研究思路与技术手段。; 阅读建议:建议读者结合文档中提供的网盘资源,下载完整代码与工具包,边学习理论边动手实践。重点关注YALMIP工具的使用方法,并通过复现文中提到的多个案例,加深对电力系统优化问题建模与求解的理解。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值