语音源分析与视听语音处理技术概述
语音源分析相关技术
语音源分析在语音处理领域至关重要,近期研究主要围绕基于频谱相位或瞬时相位的方法展开。
- 声门流模型表示
- 深入研究声门流发现,声门流模型可用因果 - 反因果(混合相位)滤波器表示。这一发现为后续的语音分析和合成提供了新的理论基础。
- 时域和声谱域参数之间的联系得以建立,大多数时域声门流模型都有相应的方程,这有助于更准确地理解和处理声门流信号。
- 新的声门模型与语音表示方法
- 提出了一种用于语音合成的频谱域新声门模型——因果 - 反因果线性模型(CALM),为语音合成技术带来了新的思路。
- 利用声门流模型的混合相位特性,提出了零 Z 变换(ZZT)的语音表示方法。虽然该算法计算量较大,但能实现简单的语音分析和合成。通过与逆滤波进行源 - 声道分解的比较,发现 ZZT 在波形和频谱距离方面表现更优,并且可用于估计语音源的开放商和不对称系数。
- 声门闭合瞬间检测
- 声门闭合瞬间在时 - 频域对应特定的瞬时相位和幅度模式,这些模式可通过跨尺度的最大幅度线(LOMA)进行分析。LOMA 不仅能提供相应语音周期的能量信息,还可能有助于进一步分析声门波形的特性。
- 以图 23 为例,展示了从数据库句子中提取的短片段,图中从上到下依次为 EGG 信号、DEGG 信号、语音信号
超级会员免费看
订阅专栏 解锁全文
27

被折叠的 条评论
为什么被折叠?



