语音信号参数化与吸气噪声包络调制的研究
在语音处理领域,语音信号的参数化和吸气噪声的建模是两个重要的研究方向。本文将介绍基于听觉滤波器建模的语音信号参数化技术以及吸气噪声包络调制的更好表示方法。
基于听觉滤波器建模的语音信号参数化
-
Gammachirp滤波器
- Gammachirp滤波器的带宽是根据人类听觉滤波器的等效矩形带宽(ERB)来设置的。ERB可视为临界带宽的一种度量,与人类数据匹配良好。ERB在频率$f$(单位:Hz)的值由公式$ERB(f)=24.7 + 0.108f$给出。
- Gammachirp滤波器的傅里叶幅度谱为:$G(f)=a(n,jc)\Gamma(n + jc)e^{-2\pi bERB(f - f_0)^2 + j\theta}$,其中$\theta = \arctan(\frac{f - f_0}{bERB(f_0)})$,$\Gamma(n + jc)$是复伽马分布。
- 所使用的Gammachirp听觉滤波器组(GcFB)由34个Gammachirp滤波器组成,其中心频率在Glasberg和Moore的ERB - 率标度上,均匀分布在50 Hz到8 kHz之间。ERB - 率标度是频率与ERB数量的近似对数函数,由公式$ERBrate(f)=21.4\log_{10}(1 + \frac{f}{1000/37})$给出。
- GcFB对波形的响应产生的基底膜运动(BMM)如图1所示,高于191 Hz的通道中的活动集中显示了声道的共振,代表了波形的“共振峰”。
|参数|值|
|
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



