基于语音的疾病检测的鲁棒多视图判别学习
1. 引言
在疾病检测领域,语音分析以其无创、无痛且便捷的特点,成为了一种极具吸引力的替代方法。研究人员积极利用语音分析来检测多种疾病,如帕金森病、阿尔茨海默病、声带麻痹和声带结节等,甚至还用于评估帕金森病的严重程度。
在基于语音的疾病检测中,设计了多种判别特征来区分健康语音和病理语音,这些特征大致可分为三类:
- 第一类 :量化语音信号的周期性程度。例如,病理语音的声带振动往往偏离周期性,抖动(Jitter)和闪烁(Shimmer)是描述基频和振幅在周期内扰动的两个最具代表性的特征。此外,还有声门商(Glottal Quotient)、递归周期密度熵(Recurrence Period Density Entropy)和音高周期熵(Pitch Period Entropy)等特征。
- 第二类 :评估由于声门不完全闭合导致的语音噪声程度。其中,谐波噪声比(Harmonics to Noise Ratio)和噪声谐波比(Noise to Harmonics Ratio)是这类特征中的经典代表。
- 第三类 :采用用于语音和说话人识别的特征,如梅尔频率倒谱系数(Mel - frequency Cepstral Coefficients,MFCC)、线性预测系数(Linear Prediction Coefficients,LPC)和线性预测倒谱系数(Linear Prediction Cepstral Coefficients,LPCC)。研究表明,MFCC在疾病检测方面具有较高的可靠性。
在语音分析
超级会员免费看
订阅专栏 解锁全文
66

被折叠的 条评论
为什么被折叠?



