14、语音识别特征研究与婴儿导向语音检测

最新推荐文章于 2025-11-23 17:36:06 发布

week9

最新推荐文章于 2025-11-23 17:36:06 发布

阅读量7

点赞数

CC 4.0 BY-SA版权

分类专栏：非线性语音处理前沿文章标签：语音识别婴儿导向语音 MFCC

本文链接：https://blog.youkuaiyun.com/week9/article/details/155062431

非线性语音处理前沿专栏收录该内容

21 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

语音识别特征研究与婴儿导向语音检测

1. 语音识别特征实验与分析

在语音识别领域，为了限制特征向量的大小，对于包含四种和五种特征的特征集组合，采用了“Scales - 50”版本。所有特征集都添加了原始帧的对数能量以及一阶和二阶差分系数，随后通过线性判别分析（LDA）将特征数量减少到 47 个，LDA 的降维矩阵基于男性和女性语音中包含的 48 个语音类别。

1.1 单个特征类型的测试结果

首先，对之前描述的所有特征类型在三种场景（FM - FM、M - F、F - M）下进行了单独测试，结果如下表所示：
| 特征类型 | FM - FM | M - F | F - M |
| — | — | — | — |
| MFCC | 66.57 | 55.00 | 52.42 |
| RT | 58.39 | 55.30 | 51.99 |
| MRT | 57.90 | 53.88 | 50.75 |
| QT | 53.00 | 48.03 | 46.12 |
| MT | 59.96 | 56.53 | 54.45 |
| RTScales | 64.29 | 57.36 | 56.67 |
| MRTScales | 64.27 | 58.90 | 58.42 |
| QTScales | 62.64 | 56.75 | 55.34 |
| MTScales | 64.05 | 58.79 | 58.02 |
| RTScales - 50 | 64.47 | 55.49 | 54.28 |
| MRTScales - 50 | 64.08 |