心音分类任务,使用ExtraTrees分类器效果acc达到95.73,auc99.7

摘要

心脏疾病很严重,必须在早期使用高精度的常规听诊检查进行诊断。心脏听诊是一种使用电子听诊器分析和收听心音的技术,电子听诊器是一种提供心音数字记录的设备,称为心音图 (PCG)。该 PCG 信号携带有关心脏功能和状态的有用信息,因此可以应用多种信号处理和机器学习技术来研究和诊断心脏疾病。根据 PCG 信号,心音信号可分为两大类,即正常和异常。我们创建了来自各种来源的 5 类心音信号(PCG 信号)的数据库,其中包含 1 类正常和 4 类异常。本研究提出了一种改进的、按心音信号对心脏疾病进行自动分类的算法。我们从心动图信号中提取特征,然后使用机器学习技术处理这些特征进行分类。在特征提取方面,我们使用了来自心音信号的梅尔频率倒谱系数 (MFCCs) 和离散小波变换 (DWT) 特征,对于学习和分类,我们使用了ExtraTrees。为了提高结果和分类准确性,我们将 MFCC 和 DWT 特征相结合,ExtraTrees进行训练和分类。从我们的实验中可以清楚地看出,当 Mel 频率倒谱系数和离散小波变换特征融合在一起并通过支持ExtraTrees进行分类时,结果可以大大改善。本文讨论的方法可用于诊断患者的心脏病,准确率高达 95.7%。

背景

人的心脏由四个腔室组成。其中两个称为心房,它们构成心脏的上部,而剩下的两个腔室称为心室,它们构成心脏的下部,血液通过心房进入心脏,通过心室流出。正常的心音(图 1a 是正常心音信号的一个例子)是通过关闭和打开心脏瓣膜产生的。产生的心音信号与瓣膜的打开和关闭、血流和粘度直接相关。因此,在运动或其他增加心率的活动中,通过瓣膜的血流量增加,因此心音信号的强度增加,而在休克(低血流量)期间,声音信号的强度降低 [2]。图 1f 还显示了 PCG 信号的频谱。

图 1.a) 正常的心音信号;(b) 收缩期杂音 (MVP);(c) 二尖瓣反流 (MR);(d) 二尖瓣狭窄 (MS);(e) 主动脉瓣狭窄 (AS);(f) PCG 信号的频谱。

心脏瓣膜的运动会产生频率范围低于 2 kHz 的可听见声音,通常称为“lub-dub”“lub”是心音信号的第一部分,用 (S1) 表示,它是由二尖瓣和三尖瓣关闭产生的。一个完整的心动周期是从 S1 开始到下一个 S1 开始的心音信号波,它被描述为一次心跳。心音的持续时间、音调和形状向我们展示了心脏不同状况的详细信息 [4]。关闭二尖瓣后再关闭三尖瓣,通常此操作之间的延迟为 20 至 30 毫秒。由于首先是左心室收缩,因此信号中首先出现二尖瓣成分,然后是三尖瓣成分。如果这两个声音分量之间的持续时间在 100 到 200 毫秒之间,则称为分裂,其频率范围为 40 至 200 Hz,如果延迟超过 30 毫秒,则被认为是致命的 [7]。“Dub”,当主动脉瓣和肺动脉瓣关闭时产生(第二个心音分量用“S2”表示)。S1 通常比 S2 具有更长的时间段和更低的频率,而 S2 的持续时间更短,但频率范围更高(50 至 250 Hz)。A2 是由于主动脉瓣运动而产生的另一种心音信号成分,P2 是由于肺动脉瓣运动而产生的另一种心音信号成分。与肺动脉压相比,主动脉压更高,因此 A2 分量在心音信号中出现在 P2 之前。通过仔细分析主动脉成分 A2 和肺成分 P2 之间的分裂及其强度,可以确定肺动脉瓣狭窄和房间隔缺损等心脏病的存在。在深度情绪和兴奋状态下,A2 和 P2 之间的持续时间可能比平时更长,从而导致成分之间出现漫长而广泛的分裂。如果这些组件之间的延迟超过 30 毫秒,则此状态被视为致命状态 。

杂音分为连续性杂音、收缩期杂音和舒张期杂音。收缩期杂音在收缩期存在,是在心室收缩(心室射血)期间产生的。在心音成分中,它们存在于 S1 和 S2 之间,因此称为收缩期杂音。根据它们的类型,这些收缩期杂音可称为喷射性杂音(房间隔缺损、肺动脉瓣狭窄或主动脉瓣狭窄) 图 1e,或反流杂音(室间隔缺损、三尖瓣反流、二尖瓣反流或二尖瓣脱垂) 图 1c.

舒张期杂音是在舒张期(收缩期后)产生,此时心室松弛。舒张期杂音存在于第二和第一心音部分之间,这种类型的杂音通常是由于二尖瓣狭窄 (MS) 或主动脉瓣反流 (AR) 引起的,如图 1d 所示。二尖瓣脱垂 (MVP) 是一种杂音出现在收缩段之间的疾病,如图 1b 所示。AR 的杂音是高音调的,AS 的杂音是低调的。在二尖瓣反流 (mitral regurgitation, MR) 中,收缩成分 S1 要么是软的,要么是埋藏的或不存在,舒张成分 S2 广泛分裂。在二尖瓣狭窄中,杂音是低调的和隆隆声的,并沿舒张期成分存在。在二尖瓣脱垂中,杂音遍布整个 S1compnent。VSD 和 MR 的声音信号大多相似 。

总结以上讨论,我们可以看到可以使用电子听诊器获取心音信号,在每个完整的心音信号周期中,我们有 S1-S4 间期,S3 和 S4 是罕见的心音,通常听不到,但可以显示在图形记录上,即心音图 [4]。S3 和 S4 间期称为杂音,携带杂音的心音信号称为心音异常,可根据信号中的杂音位置进行分类。在这项研究中,使用五个类别、一个正常类别和四个异常类别对心音信号进行自动分类。这些异常类别是主动脉瓣狭窄 (AS)、二尖瓣反流 (MR)、二尖瓣狭窄 (MS) 和 MVP(收缩期存在杂音)。图 1 以图形方式明确显示了这些心音信号。

心音信号的分类可以通过几个可用于生物医学信号处理的机器学习分类器来执行。其中之一是 SVM,可用于心音分类。SVM 是完全作用于统计学习和定理的机器学习、分类和识别技术,SVM 的分类精度比传统的分类技术要高效得多 [8]。另一个最近受到关注的分类器是 DNN,DNN 声学模型在语音处理以及其他生物医学信号处理方面具有很高的性能。在本文中,我们的研究表明,这些分类器(SVM 和 DNN 也是基于质心位移的 KNN)在心音信号分类方面具有良好的性能。卷积神经网络的性能是针对图像分类进行了优化的,因此这种方法并不适合我们在本文中使用的特征集。我们还在试点测试中使用了递归神经网络,但我们的 DNN 方法显示出更好的结果。

数据集介绍

数据集由两组数据组成:正常组和异常组,数据库中的全部数据(正常和异常)有五类,一类正常(N)和四类异常,这四类异常分别是:主动脉瓣狭窄(AS)、二尖瓣狭窄(MS)、二尖瓣反流(MR)、二尖瓣脱垂(MVP)、 数据的详细信息如表 1 所示,背景部分讨论了完整的详细信息(相对于类别)。正常和异常类别的音频文件总数为 1000 个(每个类别 200 个音频文件),文件格式为 .wav。我们的数据收集程序概述如图 4b 所示,其中我们首先选择心脏疾病类别,收集数据,然后在过滤后应用数据标准化

我们在提取 MFCC 特征时使用的参数和参数如下:采样频率 8000 Hz,特征向量长度为 19,样本 240 中的帧大小为 80.同样,对于使用 SVM 对 DWT 特征进行训练和分类,我们在提取 DWT 特征时使用的参数和参数如下: 采样频率 8000 Hz,特征向量长度 24。使用五重交叉验证技术,我们使用 SVM 和 DNN 对数据进行分类。从数据集来看,每个类中 20% 的样本数据用于测试,每个类中 80% 的样本数据用于训练,记录具有不同特征的每种机器学习算法相对于其给定精度的性能。

实验

和话不多说直接上结果,这是6折交叉验证的

混淆矩阵

ROC-AUC曲线

代码我下一篇发(完整的资源会稍后上传)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值