14、语音识别特征研究与婴儿导向语音检测

语音识别特征研究与婴儿导向语音检测

1. 语音识别特征实验与分析

在语音识别领域,为了限制特征向量的大小,对于包含四种和五种特征的特征集组合,采用了“Scales - 50”版本。所有特征集都添加了原始帧的对数能量以及一阶和二阶差分系数,随后通过线性判别分析(LDA)将特征数量减少到 47 个,LDA 的降维矩阵基于男性和女性语音中包含的 48 个语音类别。

1.1 单个特征类型的测试结果

首先,对之前描述的所有特征类型在三种场景(FM - FM、M - F、F - M)下进行了单独测试,结果如下表所示:
| 特征类型 | FM - FM | M - F | F - M |
| — | — | — | — |
| MFCC | 66.57 | 55.00 | 52.42 |
| RT | 58.39 | 55.30 | 51.99 |
| MRT | 57.90 | 53.88 | 50.75 |
| QT | 53.00 | 48.03 | 46.12 |
| MT | 59.96 | 56.53 | 54.45 |
| RTScales | 64.29 | 57.36 | 56.67 |
| MRTScales | 64.27 | 58.90 | 58.42 |
| QTScales | 62.64 | 56.75 | 55.34 |
| MTScales | 64.05 | 58.79 | 58.02 |
| RTScales - 50 | 64.47 | 55.49 | 54.28 |
| MRTScales - 50 | 64.08 |

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值