语音识别特征研究与婴儿导向语音检测
1. 语音识别特征实验与分析
在语音识别领域,为了限制特征向量的大小,对于包含四种和五种特征的特征集组合,采用了“Scales - 50”版本。所有特征集都添加了原始帧的对数能量以及一阶和二阶差分系数,随后通过线性判别分析(LDA)将特征数量减少到 47 个,LDA 的降维矩阵基于男性和女性语音中包含的 48 个语音类别。
1.1 单个特征类型的测试结果
首先,对之前描述的所有特征类型在三种场景(FM - FM、M - F、F - M)下进行了单独测试,结果如下表所示:
| 特征类型 | FM - FM | M - F | F - M |
| — | — | — | — |
| MFCC | 66.57 | 55.00 | 52.42 |
| RT | 58.39 | 55.30 | 51.99 |
| MRT | 57.90 | 53.88 | 50.75 |
| QT | 53.00 | 48.03 | 46.12 |
| MT | 59.96 | 56.53 | 54.45 |
| RTScales | 64.29 | 57.36 | 56.67 |
| MRTScales | 64.27 | 58.90 | 58.42 |
| QTScales | 62.64 | 56.75 | 55.34 |
| MTScales | 64.05 | 58.79 | 58.02 |
| RTScales - 50 | 64.47 | 55.49 | 54.28 |
| MRTScales - 50 | 64.08 |
超级会员免费看
订阅专栏 解锁全文
68

被折叠的 条评论
为什么被折叠?



