语音分析中的关键技术:GCI检测与帕金森病特征学习
1. 声门闭合瞬间(GCI)检测
1.1 不同算子的比较
在语音信号处理中,二阶导数、Teager-Kaiser能量算子(TKEO)和局部均值加权二阶导数在声门闭合瞬间(GCI)检测中有着不同的表现。通过对语音片段的处理结果显示,二阶导数结果在每个周期内有更多的波动;而TKEO结果在GCI附近产生峰值,在其他地方则具有较低且稳定的幅度。局部均值加权二阶导数的波形与TKEO结果相似,但TKEO结果的幅度更大。因此,可以得出结论:TKEO算子与局部均值加权二阶导数相似,并且由于其波动干扰较少,TKEO更适合用于GCI检测。
1.2 GMAT中的不同池化方法
GMAT(基于多分辨率绝对Teager-Kaiser能量算子的GCI检测方法)中使用了三种池化技术来融合多尺度aTKEO的结果,分别是最大池化(GMATmax)、多尺度乘积(GMATprod)和均值池化(GMATmean)。实验比较了这三种基于GMAT的算法性能:
|算法|可靠性|准确性|运行时间|病理语音分类性能|
|----|----|----|----|----|
|GMATmax|较低| - | - |最差|
|GMATprod|较高|较高|相对较高| - |
|GMATmean|最高|最高|较低|较好|
均值池化对异常值和噪声更具鲁棒性,因此GMATmean将用于未来的GCI检测。其流程如下:
graph LR
A[多尺度aTKEO结果] --> B[均值池化]
B -
超级会员免费看
订阅专栏 解锁全文
56

被折叠的 条评论
为什么被折叠?



