语音特征分析与说话人识别技术研究
1. 语音发声与发音特征分析在帕金森病检测中的应用
在语音分析领域,提出了用于同时分析语音发声和发音的新特征。这些特征的评估分两个阶段进行,采用了判别标准。
- 第一阶段 :使用线性贝叶斯分类器。
- 第二阶段 :使用软间隔支持向量机(SVM)。只有在第一阶段准确率超过 61%的特征才会进入第二阶段的分类。
经过第一阶段分类后,进入第二阶段的特征集包含了不同的标准特征,如基频(F0)的变异性以及元音共振峰 F1 和 F2。此外,本文引入的两个特征也进入了第二阶段:
- cent PentaF2u :基于元音 /u/ 的第二共振峰测量。
- stdV prism :汇总了在角元音 /a/、/i/、/u/ 上测量的 F0、F1 和 F2 的变异性信息。
发声分析考虑了诸如抖动、闪烁和关联维度等标准特征。结果表明,当单独评估发声特征时,抖动的判别能力最强;但当在同一表示空间中考虑这些测量时,准确率会得到提高。将发音和发声特征相结合时,帕金森病患者(PD)和健康对照者(HC)语音的自动分类准确率从 74.0%提高到了 81.3%。
2. 说话人识别中多种特征的组合研究
在说话人识别任务中,以往使用了许多特征参数,如梅尔频率倒谱系数(MFCC)、线性预测倒谱系数(LPCC)等。然而,这些特征参数更多地包含了声道特征,而发声源特征对于说话人识别也非常重要。
为了捕捉发声源特征,许多研究提出了不同的方法: <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



