线性与非线性预测残差信号在说话人验证中的应用及多滤波器组方法
1. 线性与非线性预测残差信号的作用
在说话人识别领域,残差信号与经典参数(如LPCC、melceps)的组合对识别率的提升影响显著。若不进行归一化,这相当于一种加权组合,其中LPCC距离对组合结果的影响比残差信号更大。
1.1 特征提取与识别率分析
通过对不同向量维度(P)和组合参数的识别率总结(如图3和表2),以及基于特定比率的判别能力衡量(如图5),发现该比率越高,识别率越好。同时,从图6中可以看到不同特征提取器和向量维度的均值(实线)和标准差(竖线)。对于良好的生物特征识别,期望帧内和帧间距离无重叠且尽可能分离。结果显示,非线性残差信号的重叠程度比线性残差信号大,这表明非线性残差信号在说话人识别中的潜力较小。
1.2 参数组合与识别效果
以往研究表明,经典参数与残差分析信号的某种参数化组合可提高识别率,但在实验中发现,只有当分析阶数在8到16之间时才成立。这是因为该范围内的数据量足以拟合频谱包络,无需增加参数数量。
1.3 残差信号的冗余性与非线性分析优势
对于高阶参数向量,尽管残差信号在说话人之间具有显著的判别能力,但它与LPCC或melceps似乎存在冗余,并不实用。而采用非线性分析的残差信号,与线性分析相比,组合信号的相关性更低。虽然NL残差信号的判别能力较低,但在多个分析阶数下,组合方案的性能优于线性分析。
1.4 评估残差信号相关性的流程图
为评估残差信号的相关性,可参考以下流程图:
超级会员免费看
订阅专栏 解锁全文
26

被折叠的 条评论
为什么被折叠?



