57、儿童语音关键词识别与情绪状态研究

儿童语音关键词识别与情绪状态研究

在语音识别领域,儿童语音识别面临着诸多挑战,如基音敏感性、共振峰分散效应等。同时,对于患有自闭症谱系障碍(ASD)和智力障碍(ID)的儿童,其情绪状态的识别也具有重要的研究价值。本文将围绕儿童语音关键词识别特征以及 ASD 和 ID 儿童情绪状态识别展开详细探讨。

儿童语音关键词识别特征研究
  • TASS - MFCC - ARP 特征性能
    • 基音匹配与不匹配测试条件下的性能 :TASS - MFCC - ARP 特征融合了 DA - SPF 和共振峰增强方法的优点。为了更好地比较性能,给出了 SPS - MFCC、TAS - MFCC、TAS - MFCC - ARP 和 TASS - MFCC - ARP 的 TWV 值,以及 TASS - MFCC - ARP 相对于 TAS - MFCC - ARP 的百分比相对改进(PRI)。对于儿童测试数据,在 10 个和 20 个关键词集下,TASS - MFCC - ARP 相对于 TAS - MFCC - ARP 的 PRI 分别为 6.47% 和 3.5%;而成年人测试数据的性能非常相似。性能的提升主要得益于从共振峰增强频谱中去除了基音变化。具体数据如下表所示:
      | 关键词数量 | 测试数据 | SPS - MFCC | TAS - MFCC | TAS - MFCC - ARP | TASS - MFCC - ARP | PRI |
      | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
      | 10 | AD 测试 | 0.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值