44、基于恒定Q变换的婴儿哭声分类特征研究

基于恒定Q变换的婴儿哭声分类特征研究

1. 引言

婴儿啼哭是其与父母或照顾者交流的主要方式,哭声中蕴含着诸如情感需求、生理需求或病理需求等信息。然而,即便经验丰富的母亲和照顾者,也常常难以精准判断婴儿啼哭的具体原因。婴儿哭声研究涉及韵律工程、神经学工程等多个领域,其中正常与病理性婴儿哭声的分类研究具有重要意义。世界卫生组织(WHO)指出,若能在婴儿出生后第一周进行早期诊断和治疗,婴儿死亡率有望降低三分之二。

早期的婴儿哭声研究始于20世纪60年代,最初主要分析正常婴儿哭声,后来扩展到病理性哭声,发现发声障碍和发声亢进等哭声模式与病理状况相关。此前的研究多使用窄带频谱图来捕捉基频及其谐波的变化。在特征提取方面,虽然已有如梅尔频率倒谱系数(MFCC)等先进特征集用于婴儿哭声分类,但短时傅里叶变换(STFT)在MFCC中的应用存在时间 - 频率分辨率一致、不具备形式不变性等问题。而恒定Q变换(CQT)的窗口是时间和频率的函数,能保留形式不变性。同时,婴儿对音乐有天生的偏好,其旋律轮廓(基频及其谐波)尤为重要,因此受CQT在西方音乐中提高音符分辨率研究的启发,本文提出了基于CQT频谱分解的恒定Q谐波系数(CQHC)和恒定Q音高系数(CQPC)用于婴儿哭声分类。

2. 提出的方法
2.1 恒定Q变换(CQT)

CQT是一种频率变换,具有与西方音乐调音一致的对数分辨率,其窗口大小随频率增加而减小,这得益于恒定的品质因数(Q),从而实现对数分辨率。
设 $x(n)$ 为以采样频率 $F_s$ 获得的离散时间语音信号,其STFT为:
$X(\omega, \tau) = \sum_{n=-\infty}^{\infty} x(n

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值