12、基于改进自适应GMM和SDN的语音识别与网络安全技术

基于改进自适应GMM和SDN的语音识别与网络安全技术

基于低秩矩阵恢复的改进自适应GMM语音识别方法

语音识别是一项极具吸引力且应用广泛的任务,在生物识别系统、设施访问控制系统、安全交易等诸多领域都有重要应用。然而,在不受控的噪声环境、说话人差异以及信道/会话变化的情况下,文本无关的语音识别面临着巨大挑战。

过去,人们采用了多种方法来解决这些问题。基于自适应高斯混合模型(GMM)的通用背景模型(UBM)被用于建模目标说话人;在GMM - UBM框架下,GMM - 超向量方法通过堆叠自适应混合分量的均值得到了探索;基于GMM - 超向量的支持向量机(SVM)取得了不错的性能。为应对说话人差异和信道/会话变化问题,联合因子分析(JFA)和身份向量(i - vector)方法也被研究用于推导文本无关语音识别系统的鲁棒模型和特征。此外,稀疏表示(SR)也被用于提高语音识别系统的性能。

近期,基于观测置信度值的自适应GMM框架在鲁棒语音识别中取得了成功应用。研究人员认为,受噪声和信道变化影响或损坏的观测向量置信度较低,会降低语音识别系统的性能。因此,提出了基于观测置信度值的改进自适应GMM训练方法来克服这些问题。他们通过最优最小均方误差对数短时谱幅度(MMSE log - STSA)估计增强语音,并结合输入语音计算帧信噪比(SNR)值,进而得到观测置信度值。

本文提出了一种基于低秩矩阵恢复(LRR)计算观测置信度值的新方法。具体步骤如下:
1. 特征提取 :使用RASTA_PLP方法从音频信号中提取特征向量。
2. 观测置信度计算
- 利用LRR从输入语音中估计

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值