语音信号处理中的鲁棒估计与应用
1. 非平稳模式统计识别方法
在语音信号处理领域,非平稳模式的统计识别是一个重要的研究方向。有多种基于无监督学习的方法被用于此,包括带欧几里得距离的“c - 均值”算法(CEUC)、二次分类器的迭代过程(CIQC)、其实时操作的改进算法(RTQC)以及带滑动训练集的二次分类器(QCSTS)。
通过将这些方法应用于语音信号非平稳自回归(AR)模型参数的鲁棒递归估计中,并进行了直接和间接的实验分析。实验结果表明,QCSTS 算法在浊音语音信号分析以及包含浊音段和混合激励段的语音信号(如数字语音)分析中表现最佳。
1.1 迭代二次分类算法的不足
迭代二次分类算法在估计语音信号 AR 模型的非平稳参数时,概率估计不足。这是因为该算法与所考虑的模型不对应(混合激励可看作三类正态分布或两类未知分布),从而导致估计结果不佳。
1.2 QCSTS 算法的优势
而 QCSTS 算法以及实时操作的迭代二次分类算法改进版,对激励信号假设的两类模型的不足具有不敏感性,表现出较强的鲁棒性。通过对 RTQC 和 QCSTS 算法的比较分析,直接和间接评估都明确指出 QCSTS 算法质量更高,推荐用于语音信号非平稳 AR 模型的鲁棒递归识别。
2. 鲁棒估计器在语音信号处理中的应用
使用线性预测的鲁棒方法能够更准确地确定语音信号生成系统的 AR 模型参数,进而更精确地对声道进行建模。
2.1 鲁棒方法的优势
- 非递归 LP 方法的鲁棒化 :可降低估计对语音基频的敏感性,同时减
超级会员免费看
订阅专栏 解锁全文
2021

被折叠的 条评论
为什么被折叠?



