语音信号分析中的相位倒谱与经验模态分解方法
1. 引言
在语音和音频信号处理中,信号的相位信息至关重要。准确提取相位信息是许多语音应用(如定位、同步、编码等)的关键。然而,信号相位提取并非易事,主要是因为存在相位不连续(相位“卷绕”效应)。目前已经提出了几种相位“解卷绕”算法来解决这一问题。
本文将探讨三种不同的非线性相位特征,即傅里叶相位倒谱(FPC)、白化傅里叶相位倒谱(WFPC)和哈特利相位倒谱(HPC),并比较它们在噪声鲁棒性和相位内容封装效率方面的优劣。同时,还将介绍经验模态分解(EMD)在语音信号分析中的应用。
2. 相位倒谱
计算离散时间信号 $x(n)$ 的倒谱属于同态解卷积过程。其流程如下:
graph LR
A[x(n)] --> B[正交变换Ξ]
B --> C[非线性处理]
C --> D[逆变换Ξ⁻¹]
D --> E[x*(n)]
在这个过程中,信号 $x(n)$ 通过正交变换 $\Xi$ 转换到另一个域,对转换后的信号进行非线性处理,然后通过逆变换 $\Xi^{-1}$ 转换回原始域。在应用逆变换之前,需要补偿非线性处理步骤中产生的不连续性。下面将介绍三种不同的相位特征。
2.1 傅里叶相位倒谱(FPC)
若图中的 $\Xi$ 和 $\Xi^{-1}$ 分别表示离散时间傅里叶变换(DTFT)和逆离散时间傅里叶变换(IDTFT),非线性处理步骤是计算傅里叶相位谱:
[
\phi(\omega) = \arc
超级会员免费看
订阅专栏 解锁全文
9

被折叠的 条评论
为什么被折叠?



