非线性语音处理进展:自动声门源分析评估
在语音处理领域,对声门源的准确分析至关重要。它不仅有助于更全面地描述语音信号,还在语音合成、语音质量修改、语音病理检测和语音情感分析等方面具有重要应用。然而,自动声门源分析方法在某些情况下的鲁棒性仍有待评估。本文将介绍相关研究,探讨自动声门逆滤波和声门源参数化方法的性能。
1. NOLISP 简介
NOLISP 是一个关于非线性语音处理的 ISCA 教程和研讨会,每两年举办一次。其目的是展示和讨论与主流方法不同的语音处理新思路、新技术和新成果。该研讨会定义了以下感兴趣的领域:
1. 非线性逼近和估计
2. 非线性振荡器和预测器
3. 高阶统计
4. 独立成分分析
5. 最近邻
6. 神经网络
7. 决策树
8. 非参数模型
9. 非线性系统动力学
10. 分形方法
11. 混沌建模
12. 非线性微分方程
2. 自动声门源分析的重要性
语音产生过程可看作是声带振动产生的声门源信号,通过声道的共振结构,最终从嘴唇辐射出去。在语音处理中,大多数声学描述主要关注声道对语音信号的贡献。但越来越多的证据表明,分别开发声道和声门源组件的独立特征集,能更全面地描述语音信号。
3. 自动声门源分析面临的挑战
尽管声门源特征具有潜力,但声门源分析方法在某些情况下被认为缺乏鲁棒性。例如,高音调语音在逆滤波时存在问题,尤其是与低第一共振峰频率结合时。此外,声门源分析通常需要在消声室或工作室环境中使用高质量设备进行录制。不过,一些研究发现,在不太理想的录制条件下获得的声门源参数,
超级会员免费看
订阅专栏 解锁全文
6356

被折叠的 条评论
为什么被折叠?



