12、基于改进自适应GMM和SDN的语音识别与网络安全技术-优快云博客

本文链接：https://blog.youkuaiyun.com/cake8/article/details/153901824

基于改进自适应GMM和SDN的语音识别与网络安全技术

基于低秩矩阵恢复的改进自适应GMM语音识别方法

语音识别是一项极具吸引力且应用广泛的任务，在生物识别系统、设施访问控制系统、安全交易等诸多领域都有重要应用。然而，在不受控的噪声环境、说话人差异以及信道/会话变化的情况下，文本无关的语音识别面临着巨大挑战。

过去，人们采用了多种方法来解决这些问题。基于自适应高斯混合模型（GMM）的通用背景模型（UBM）被用于建模目标说话人；在GMM - UBM框架下，GMM - 超向量方法通过堆叠自适应混合分量的均值得到了探索；基于GMM - 超向量的支持向量机（SVM）取得了不错的性能。为应对说话人差异和信道/会话变化问题，联合因子分析（JFA）和身份向量（i - vector）方法也被研究用于推导文本无关语音识别系统的鲁棒模型和特征。此外，稀疏表示（SR）也被用于提高语音识别系统的性能。

近期，基于观测置信度值的自适应GMM框架在鲁棒语音识别中取得了成功应用。研究人员认为，受噪声和信道变化影响或损坏的观测向量置信度较低，会降低语音识别系统的性能。因此，提出了基于观测置信度值的改进自适应GMM训练方法来克服这些问题。他们通过最优最小均方误差对数短时谱幅度（MMSE log - STSA）估计增强语音，并结合输入语音计算帧信噪比（SNR）值，进而得到观测置信度值。

本文提出了一种基于低秩矩阵恢复（LRR）计算观测置信度值的新方法。具体步骤如下：
1. 特征提取 ：使用RASTA_PLP方法从音频信号中提取特征向量。
2. 观测置信度计算 ：
- 利用LRR从输入语音中估计