语音信号分析中的关键技术研究
在语音信号处理领域,语音源特征的转换以及多基频估计是两个重要的研究方向。前者在富有表现力的语音合成和语音质量控制方面具有重要意义,后者则在语音信号分析的诸多应用中发挥着关键作用。下面将详细介绍这两个方面的相关研究。
平稳歌唱语音的声门源模型选择
研究背景与目标
语音源特征的转换是富有表现力的语音合成和语音质量控制中的重要挑战。实现这一转换的关键在于对语音激励(源)特征的建模,但源和滤波器贡献的稳健分解因存在非线性相互作用而面临挑战,限制了逆滤波过程的稳健性。
研究旨在对平稳歌唱语音样本进行语音激励建模,为未来的语音质量修改做准备。通过选择近似模型来简化声门源特征的建模过程,研究聚焦于基于Rd参数选择Liljencrants - Fant(LF)模型,并提出了基于准确频谱包络信息的“归一化低频带包络”(NLBE)选择策略。
Rd参数与语音质量建模
Rd参数可量化LF模型参数(Ra、Rk、Rg)的特征趋势,从紧密内收的发声(Rd ≈ 0.3)到非常气声外展的发声(Rd ≥ 2.7)。在这个范围内,可区分出三种主要的语音质量:紧压音、模态音(正常音)和气声音。对于平稳歌唱,尤其是模态音演唱,Rd估计值应接近模态值,且随时间变化缓慢且范围窄。
NLBE声门源模型选择方法
基于Rd的语音质量建模
Rd参数能够量化LF模型参数的特征趋势,涵盖从紧压发声到气声发声的范围。在这个范围内,存在三种主要的语音质量:紧压音、模态音和气声音。研究聚焦于模态音演唱的平稳歌唱,预期Rd估计值接近模态值且变化缓慢。
超级会员免费看
订阅专栏 解锁全文
2027

被折叠的 条评论
为什么被折叠?



