语音处理中的非线性技术与声源分析
语音处理领域在过去二十年取得了巨大的发展,但仍有一些语音信号的特性未被现有模型很好地解决。因此,探索新的非传统模型和处理技术对于推动未来的发展至关重要。本文将介绍非线性语音处理中的一些重要概念和方法,特别是基于相位的声源分析方法。
1. 非线性语音处理会议概述
2007 年 5 月 22 - 25 日在法国巴黎举行的国际非线性语音处理会议(NOLISP 2007),由巴黎第六大学(UPMC)组织,并得到了国际语音通信协会(ISCA)、欧洲信号、语音和图像处理协会(EURASIP)以及电气和电子工程师协会(IEEE)的慷慨支持。该会议是一系列早期非线性语音处理活动的后续,旨在展示和讨论与语音处理替代技术相关的新颖想法、工作和成果。
会议涵盖的主题包括:
- 非线性和非传统技术
- 语音合成
- 说话人识别
- 语音识别
- 语音分析
- 非线性技术的应用
2. 声源分析的重要性和挑战
声源分析在语音和语音处理中具有重要意义,应用广泛,如源声道分解、共振峰估计、基音同步处理、低速率语音编码、说话人特征描述、歌唱、语音合成、语音和韵律分析、语音病理学和语音质量评估等。然而,声源分析也是语音处理中的一个难题,主要原因如下:
- 通常没有可测量的“真实”声源和声道组件的参考。
- 语音和语音信号是快速时变的,并且存在较大的个体和主体间差异。
- 目前对源声道相互作用的了解还不够深入,在强相互作用可能发生的情况下,声源分解可能存在问题。
3. 相位的定义
在信号处理中,“相位”有多种
基于相位的声源分析技术
超级会员免费看
订阅专栏 解锁全文
977

被折叠的 条评论
为什么被折叠?



