基于特征学习的帕金森病检测方法研究
1. 特征学习技术概述
特征学习技术在环境声音分类和语音情感识别等领域已展现出强大的能力。与传统特征提取相比,它具有两大优势:
- 任务特异性 :特征学习是针对每个任务进行的,所学习到的特征具有任务特异性。传统的手工特征设计成本高,常一个类型的特征用于多个任务,效果并非最优。
- 鲁棒性 :学习到的特征对无关因素更具鲁棒性。例如在语音情感识别任务中,学习到的特征对说话者的变化更具鲁棒性。
虽然深度特征学习的参数调整具有挑战性,但简单的特征学习方法,如单参数的球形 K - 均值,也具有很强的竞争力。因此,我们将特征学习技术应用于帕金森病(PD)检测,以获取具有高辨别力和对说话者变化等因素具有鲁棒性的特征。
2. 提出的特征学习方法
2.1 系统流程
整个方法的流程如下:
graph LR
A[语音样本] --> B[预处理]
B --> C[梅尔频谱图]
C --> D[基于球形 K - 均值的字典学习]
D --> E[编码和池化]
E --> F[学习到的特征]
2.2 预处理
- 将语音样本分割成重叠帧,采用 Hamming 窗,帧长 50 ms,帧间时间增量 25 ms。
- 利用 Martin(2001)提出的检测器进行语音活动检测(VAD),去除无声部
超级会员免费看
订阅专栏 解锁全文
1588

被折叠的 条评论
为什么被折叠?



