基于改进自适应GMM和SDN的语音识别与网络安全技术
基于低秩矩阵恢复的改进自适应GMM语音识别方法
语音识别是一项极具吸引力且应用广泛的任务,在生物识别系统、设施访问控制系统、安全交易等诸多领域都有重要应用。然而,在不受控的噪声环境、说话人差异以及信道/会话变化的情况下,文本无关的语音识别面临着巨大挑战。
过去,人们采用了多种方法来解决这些问题。基于自适应高斯混合模型(GMM)的通用背景模型(UBM)被用于建模目标说话人;在GMM - UBM框架下,GMM - 超向量方法通过堆叠自适应混合分量的均值得到了探索;基于GMM - 超向量的支持向量机(SVM)取得了不错的性能。为应对说话人差异和信道/会话变化问题,联合因子分析(JFA)和身份向量(i - vector)方法也被研究用于推导文本无关语音识别系统的鲁棒模型和特征。此外,稀疏表示(SR)也被用于提高语音识别系统的性能。
近期,基于观测置信度值的自适应GMM框架在鲁棒语音识别中取得了成功应用。研究人员认为,受噪声和信道变化影响或损坏的观测向量置信度较低,会降低语音识别系统的性能。因此,提出了基于观测置信度值的改进自适应GMM训练方法来克服这些问题。他们通过最优最小均方误差对数短时谱幅度(MMSE log - STSA)估计增强语音,并结合输入语音计算帧信噪比(SNR)值,进而得到观测置信度值。
本文提出了一种基于低秩矩阵恢复(LRR)计算观测置信度值的新方法。具体步骤如下:
1. 特征提取 :使用RASTA_PLP方法从音频信号中提取特征向量。
2. 观测置信度计算 :
- 利用LRR从输入语音中估计
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



