利用人工智能进行咳嗽声音疾病检测
1. 引言
自严重急性呼吸综合征冠状病毒 2(SARS-CoV-2)被发现以来,全球范围内爆发了持续两年多的新冠疫情。截至 2022 年 6 月,世界卫生组织报告的确诊病例总数达到 530,896,347 例,死亡病例达 6,301,020 例。咳嗽是新冠常见症状之一,咳嗽的声音和类型中包含着有助于疾病诊断的有用特征。
近年来,基于特征工程与人工智能的方法被用于通过咳嗽声音对不同呼吸道疾病进行分类,这为通过咳嗽声音检测新冠奠定了基础。这种方法可以快速便捷地预筛病毒的存在,有助于减少病毒在社区的传播,也能辅助医疗人员决策,促进早期干预。
常用于咳嗽声音检测的模型有线性回归(LR)、卷积神经网络(CNN)和支持向量机(SVM)。本研究分别基于相关工作训练了支持向量机(SVM)、ResNet 和传统 CNN 模型,旨在研究这些模型在不同来源数据集上的泛化能力。研究使用了来自不同众包数据收集应用的两个数据集,分别是剑桥大学的新冠声音数据集和印度科学研究所(IISc)班加罗尔的 Coswara 项目的音频数据。
2. 相关工作
2.1 咳嗽声音阶段
典型的咳嗽声音可分为三个阶段:
- 爆发阶段:首先听到的爆发性声音,主要是类似噪声的波形。
- 中间阶段:对应气流减少和声音振幅降低。
- 发声或声门阶段:声门部分闭合振动产生有规律的周期性噪声。
患病患者在一次呼吸或几次呼吸间隔后,可能会出现一连串长时间的爆发性咳嗽,即咳嗽“时期”“阵咳”等。这些阶段会反映在咳嗽记录的波形中。
2.2 特征提取
从咳
基于AI的咳嗽声音疾病检测研究
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



