基音估计中的谐波增强技术
1. 基音估计的重要性与应用
基音估计在许多语音相关应用中至关重要。对于浊音语音,基音通常被视为声带振动频率的听觉感受。高音对应快速振动,低音对应缓慢振荡。由于这种感知的主观性,研究人员常使用客观的科学概念——基频,在本文中,基音估计即指基频的检测。
基音估计的应用广泛,涵盖了语音增强、编码、合成、识别以及语音病理学等多个领域:
- 语音增强 :基音可用于重建在噪声抑制过程中失真的谐波结构。
- 语音编码 :许多系统基于经典的源 - 滤波器模型,基音有助于对周期性源进行正确编码。
- 语音合成 :源 - 滤波器模型在其中起着重要作用,使得基音在该应用中不可或缺。
- 语音识别 :包括说话人识别、情感识别和语音识别等任务,精确的基音估计不仅是重要的判别特征,还可作为提取其他特征的辅助同步工具。
- 语音病理学 :持续元音的基音变化(抖动)被广泛应用于帕金森病、声带结节和息肉等疾病的诊断。
2. 现有基音估计算法概述
2.1 算法分类
现有的基音估计算法众多,可分为多基音估计器和单基音估计器。本文主要研究单基音估计情况,其方法又可分为参数化和非参数化两类。参数化方法通常基于一些假设构建模型,然后使用最大似然(ML)或最大后验(MAP)来估计模型参数,但如果建模假设不严格满足,其效果会变差,因此本文主要关注非参数化算法。
基音估计中的谐波增强技术
超级会员免费看
订阅专栏 解锁全文
3916

被折叠的 条评论
为什么被折叠?



