基于LPC和MFCC的骨传导语音信号增强及概念不一致性测量
骨传导语音信号增强
在语音处理领域,骨传导(BC)语音信号增强一直是一个重要的研究方向。此前已有众多研究致力于此,但大多方法存在一定局限性,要么改进效果不显著,要么系统复杂难以实时实现。本文聚焦于两种常见的信号处理方案——线性预测编码(LPC)和梅尔频率倒谱系数(MFCC),并对它们在BC语音信号增强方面的应用进行了研究和比较。
LPC分析
线性预测编码(LPC)是语音处理中常用的方法。其原理是利用一定数量的先前样本值来预测下一个即将到来的样本值,LPC系数则决定了预测样本值与原始样本值的接近程度。此外,LPC系数还可用于估计语音信号的共振峰,进而对声道参数进行建模。
在BC语音信号增强中,LPC的具体操作步骤如下:
1. 计算空气传导语音信号的LPC系数 :使用MATLAB函数‘lpc’计算空气传导语音信号的LPC系数,这些系数描述了语音的声道参数。
2. 生成转移函数 :根据公式 $H(z) = \frac{1}{1 + \sum_{k=1}^{n} a_{k}z^{-k}}$ 生成转移函数,其中 $n$ 是LPC转移函数的阶数,$a_{k}$ 是第 $k$ 个LPC系数。
3. 处理BC语音信号 :获取BC语音信号,以同样的方式生成其等效转移函数。该转移函数描述了骨传导对语音的影响。将获取的BC信号通过一个滤波器,该滤波器的转移函数是BC LPC系数生成的转移函数的逆,这样可以去除BC语音中引入的所有骨传导参数,只留下声门脉冲。
4.