录音工作室中的机器学习语音识别
1. 引言
人机交互(HCI)目前还无法读取人类的思想,因此在解读人类情感方面存在困难。基于机器的情感智能和对情感的基本理解,对于计算机系统恰当地响应人类情感表现至关重要。在对话中,人们通过言语和肢体语言有意识或无意识地传达情感。随着系统对识别说话者健康状态和影响状态的需求增加,对声音的分析和感知成为了极具吸引力的研究领域。
语音质量评估推动了新技术的发展,这些技术可应用于众多领域,尤其是医疗领域,如频道检索、自动化、电子教育、娱乐、呼叫中心和录音工作室监控。随着全球呼叫中心的不断增加,录音工作室监控的应用变得越来越重要。许多企业通过呼叫中心进行电话营销,其成功往往取决于操作员的素质以及客户的反馈。然而,评估代理的效率和服务质量可能具有挑战性。例如,一家拥有30名操作员,每人每周工作4天,每天工作7小时的公司,一个月的通话时长约为6720小时,逐一分析每个电话是非常困难的。
另一个潜在应用是自动电话系统,它允许用户与系统进行更深入的交互。这些程序通过语音用户请求机制实现语音识别,语音识别技术可以提高通话响应的速度和准确性。如果自动系统判断来电者感到沮丧或困惑,可以将其转接给人工客服。这对于许多难以理解自动电话服务的老年人来说尤其有用。
过去的研究中,Petrushin在2000年创建了一个系统来监控呼叫中心的语音邮件,并根据情感内容进行分类。Liscombe等人在2005年利用说话方式和话语变量来考虑口语对话系统中的说话者情感。为了让客户满意,呼叫中心需要跟踪个别投诉并为客服代表提供充分的培训,同时还需要过滤可能干扰客户对话的背景噪音。
目前,大多数从语音中检测健康状态的研究集中在传统方法上,即将输入语音信号
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



