提升文本无关说话人识别与验证及软件信息网站标签推荐的新方法
在当今数字化时代,信息安全和高效信息组织变得至关重要。说话人识别技术作为一种生物识别方式,以及软件信息网站的标签推荐技术,都在各自领域发挥着关键作用。本文将介绍基于高斯混合模型(GMM)的说话人识别与验证系统的改进方法,以及使用基于注意力机制的双向长短期记忆网络(Bi - LSTM)的软件信息网站标签推荐新方法。
基于高斯混合模型的说话人识别与验证
说话人识别概述
随着科技的发展,远程协作数据处理和网上银行等敏感领域对信息安全提出了更高要求。传统的密码、磁卡等身份验证方式容易被盗取或遗忘,因此生物识别技术应运而生。说话人识别利用个体的声音作为生物特征进行身份识别,具有方便自然且能携带大量说话人相关信息的优点。
说话人识别主要包括说话人识别和说话人验证两个基本任务。说话人识别是从一组已知说话人的声音中确定正在说话的人是谁,系统需要进行 1:N 分类;说话人验证则是判断一个人是否是他/她声称的那个人。此外,说话人识别应用可分为文本相关和文本无关两种类型,文本无关的说话人识别更具挑战性,但也提供了更大的灵活性。
在说话人识别领域的研究中,特征提取和分类方法是关键部分。目前,高斯混合模型(GMM)是最常用且有效的工具之一,而倒谱特征,特别是梅尔频率倒谱系数(MFCC)在说话人识别应用中表现最佳。然而,在实际应用中,当遇到测试语音短或计算资源有限等情况时,基于 GMM 的说话人识别系统性能会严重下降。
提出的方法
为了解决上述问题,研究人员提出了一种基于新的低维特征向量的方法来改进 GMM 系统性能。传统的 GMM 系统在处理短语音时表现不佳,
超级会员免费看
订阅专栏 解锁全文
1396

被折叠的 条评论
为什么被折叠?



