基于相位的语音源分析方法
语音质量通常可以通过频谱参数来更好地描述,例如频谱倾斜、一次谐波的相对幅度、谐波丰富因子、抛物线频谱参数等。声门流模型(GFM)有一个显著的频谱特征,即在声门流导数频谱的一次谐波区域会出现一个频谱峰值,这个峰值被称为“声门共振峰”,不过它并非像声道共振峰那样的共振。
1. 声门流模型研究目标
为了系统地解决频谱语音质量与声门源参数之间的联系问题,需要开展以下工作:
- 研究最常见声门流模型的频谱行为。
- 推导时域参数与频谱参数之间的关系。
- 为声门流参数的频谱估计或修改提供一些线索。
2. 常见声门流模型
文献中提出了多种声门流模型,下面介绍几种常见的模型:
| 模型名称 | 模型描述 | 参数 |
| ---- | ---- | ---- |
| KLGLOTT88模型(Klatt & Klatt, 1990) | 声门流由一个三阶多项式建模,可能使用低通滤波方法进行平滑处理。 | Av、T0、Oq 和 TL(低通滤波器在3000Hz处的衰减,dB),不对称性固定为 αm = 2 / 3。 |
| R++模型(Veldhuis, 1998) | 声门流的开放阶段由一个四阶多项式组成,随后是一个指数返回阶段。 | K(幅度系数)、T0、Te、Tp 和 Ta,声门流在周期结束时精确返回0。 |
| Rosenberg C(Rosenberg, 1971) | 声门流由两个正弦部分组成。 | Av、T0、Tp 和 Tn = Te - Tp,不处理平滑闭合情况。 |
| LF模型(Fant & Liljencrants, 198
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



