60、婴儿哭声分类与语音障碍识别的机器学习研究

婴儿哭声分类与语音障碍识别的机器学习研究

在医疗领域,婴儿哭声分类和语音障碍识别是两个重要的研究方向。前者有助于通过分析婴儿哭声来检测潜在的健康问题,后者则能辅助医生快速准确地诊断语音障碍。本文将介绍相关研究中使用的特征、模型以及实验结果。

婴儿哭声分类
  • 特征提取与模型架构
    • 特征集 :研究提出了基于激励源的线性频率残差倒谱系数(LFRCC)特征集,并将其性能与传统的梅尔频率倒谱系数(MFCC)和线性频率倒谱系数(LFCC)进行比较。39维的MFCC和LFCC特征通过30ms的窗口长度和15ms的窗口重叠进行提取,每个特征集包含13维静态特征、13维一阶差分特征和13维二阶差分特征。
    • CNN架构 :以下是CNN的架构表:
      |输出大小|描述|
      | ---- | ---- |
      |(39,893,16)|LFCC|
      |(19,446,16)|卷积层,16个滤波器,批量归一化(BN),ReLU激活函数|
      |(19,446,16)|最大池化,(2,2),丢弃率0.25|
      |(19,446,32)|卷积层,32个滤波器,BN,ReLU|
      |(9,223,32)|最大池化,(2,2),丢弃率0.25|
      |(9,223,64)|卷积层,64个滤波器,BN,ReLU|
      |(4,111,64)|最大池化,(2,2),丢弃率0.25|
      |(4,111,16)|卷积层,16个滤波器,BN,ReLU|
      |(4,111,16)|丢弃率0.25|
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值