语音特征提取与分类技术研究
在语音处理领域,特征提取和分类技术对于语音信号的分析和识别至关重要。本文将介绍两项相关研究:一是关于母亲语(motherese)检测的多特征多分类器研究,二是基于平均最佳基(Mean Best Basis,MBB)算法的小波语音特征提取方法。
母亲语检测研究
数据库描述
研究中需要寻找一个包含自然情感语音且有副语言或情感标注的语音数据库。最终选择了常用于儿童发展研究的自然自发交互数据库(家庭家庭电影)。该数据库满足需求,包含文本无关、说话人无关、真实自然的语音数据,并且有心理语言学家对母亲言语交互的人工标注,分为母亲语和正常指向性言语两类。从人工标注中提取了159个母亲语话语和152个正常指向性言语话语,话语长度通常在0.5秒到4秒之间。
单独分类器结果
- GMM分类器 :使用对角协方差矩阵的GMM对所有特征进行建模,并优化每个特征集的高斯混合数量。结果表明,使用频谱MFCC特征训练的GMM分类器性能优于其他特征训练的GMM分类器。
- SVM分类器 :使用线性核,对扩展特征进行训练。使用Bark特征的第一种方法TL的SVM性能优于其他SVM。
- K - nn分类器 :调整邻居数量(k),使用所有统计量Bark特征的k - NN性能优于其他特征。
- 神经网络(MLP) :使用多层感知器,所有统计量的Bark特征的MLP准确率最高。
综合来看,对于母
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



