20、基于非线性动力学 HMM 变换的连续语音喉病理自动检测

基于非线性动力学 HMM 变换的连续语音喉病理自动检测

1. 引言

多年来,语音病理检测主要通过声学、倒谱和语音扰动分析来实现。在持续语音和连续语音检测中都取得了不错的成果。然而,在无法估计音高周期的情况下,如病理程度严重时,这些特征存在稳定性和准确性问题。

语音产生过程中声带振动的非线性行为已被证实,目前研究人员正致力于利用非线性动力学(NLD)开发自动、准确的语音病理检测方法。这一问题主要可从两个方面解决:持续发声评估和连续语音评估。

在使用 NLD 特征评估持续发声时,有研究报告称考虑一组六个 NLD 特征(如互信息的第一个最小值、相关维度等)时,准确率可达 99.69%;也有仅考虑相关维度时,成功率为 94.44%。还有研究将声学、倒谱、扰动和 NLD 特征混合评估持续语音,准确率达 98.23%。

对于连续语音,它包含了更多音高周期、节奏、语调等超音段特征的信息。有研究考虑十四种梅尔频率倒谱系数等特征,在部分数据库上准确率达 96.3%;也有通过不同抖动实现方式,在数据库所有语音记录上自动检测喉病理,准确率达 94.82%;还有考虑 NLD 特征统计量来表征连续语音信号,准确率达 95%。

为实现病理语音信号和健康记录的自动分类,本文引入不同 NLD 特征,考虑了四个复杂度度量:相关维度(Dc)、最大 Lyapunov 指数(λmax)、Hurst 指数(H)和 Lempel - Ziv 复杂度(LZC)。这些特征通过隐马尔可夫模型(HMM)和应用于 HMM 的核进行建模,最后使用支持向量机(SVM)进行分类。

2. 非线性动力学(NLD)特征描述

NLD 特征在语音产生过程中存在非线性

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值