阿尔茨海默病的语音检测研究
1. 语音特征提取与分析
在语音信号处理中,我们从每个语音样本中提取了75个特征,这些特征涵盖了语音的多个方面,为后续的研究和诊断提供了丰富的数据基础。
1.1 停顿相关特征
我们采用了三种方法将语音信号分割为说话期和停顿期:
- 基于音高检测 :使用YAAPT算法检测说话者的音高,将无声音且时长超过200ms的时段判定为停顿,有声段需长于50ms。
- 基于能量检测 :通过设置信号能量阈值来区分语音和停顿。
- 基于语音活动检测(VAD) :利用Sohn等人(1999)的VAD方法进行检测。
停顿相关的特征包括总停顿次数、不同时长停顿的比例等,具体特征如下表所示:
| Feature name | Explanation |
| — | — |
| tot_utter_len | 排除首尾停顿后的话语总长度 |
| tot_n_pauses | 语音话语中的总停顿次数 |
| frac_speech_len | 语音在总话语长度中所占的比例 |
| frac_p_len | 停顿在总话语长度中所占的比例 |
| frac_p_lt_0.5s | 时长小于0.5s的停顿比例 |
| frac_p_0.5_1s | 时长在0.5 - 1s之间的停顿比例 |
| frac_p_gt_1s | 时长大于1s的停顿比例 |
| … | … |
通过对这些停顿特征的分析,我们发现
超级会员免费看
订阅专栏 解锁全文
59

被折叠的 条评论
为什么被折叠?



