语音信号基音频率与共振峰跟踪算法研究
在语音处理领域,基音频率估计和共振峰跟踪是两个重要的研究方向。基音频率反映了语音信号的基本周期特征,而共振峰则与语音的音色和语义信息密切相关。本文将介绍两种算法,一种是基于谱多尺度积的基音频率估计算法,另一种是基于傅里叶脊线检测的共振峰跟踪算法。
基于谱多尺度积的基音频率估计算法
基音频率估计对于语音处理至关重要,它在语音合成、语音识别等领域都有广泛的应用。下面详细介绍基于谱多尺度积的基音频率估计算法。
- 算法步骤 :
1. 计算语音小波变换系数的乘积 :使用二次样条函数在三个连续的二进尺度 (s1 = 2^{-1}),(s2 = 2^0) 和 (s3 = 2^1) 上对语音信号进行小波变换,然后计算这些变换系数的乘积。
2. 计算快速傅里叶变换(FFT) :将上一步得到的乘积信号分解成长度为 4096 样本的窗口,在采样频率为 20 kHz 的情况下,将乘积分解为长度为 1024 样本、重叠 512 点的帧。对每个加权块 (pw[n]) 使用离散傅里叶变换(FFT)转换到频谱域,以提取频谱参数 (Pw[k])。
3. 选择对应基音频率的峰值 :定位并对每个窗口中的所有最大值进行排序,选择具有最多谐波的系列,该系列的第一个峰值即为基音频率。
graph LR
A[语音信号] --> B[计算小波变换系数乘积]
B --> C[计算 FFT]
C --> D
超级会员免费看
订阅专栏 解锁全文
20

被折叠的 条评论
为什么被折叠?



