基于人工智能的咳嗽声疾病检测
1. 引言
自严重急性呼吸综合征冠状病毒 2(SARS - CoV - 2)被发现以来,全球新冠疫情已持续两年多。截至 2022 年 6 月,全球累计确诊病例达 5.30896347 亿例,死亡病例 630.102 万例。咳嗽是新冠常见症状之一,咳嗽声音和类型包含有助于疾病诊断的有用特征。
人工智能和信号处理在肺部疾病预测方面展现出潜力,为非侵入式新冠筛查提供了平台,有助于快速筛查病毒,促进早期检测。本研究聚焦于使用从众包应用收集的咳嗽声,利用人工智能和信号处理方法检测新冠。研究训练了支持向量机(SVM)、ResNet 和传统卷积神经网络(CNN)三种模型,旨在研究这些模型在不同来源数据集上的泛化能力。
2. 相关工作
2.1 咳嗽声阶段
咳嗽声通常分为三个阶段:
- 爆发阶段:首先听到的爆发性声音,主要是类似噪声的波形。
- 中间阶段:气流和声音振幅下降。
- 发声或声门阶段:声门部分闭合振动产生有规律的周期性噪声。
患病患者可能在一次或几次呼吸后出现长时间的爆发性咳嗽,即咳嗽“时期”“阵咳”等。这些阶段会反映在咳嗽记录波形中。
2.2 特征提取
从咳嗽声中提取的特征常见的有梅尔频率倒谱系数(MFCC)、短时傅里叶变换(STFT)、对数梅尔和梅尔频谱图。研究表明,梅尔频谱提取的特征效果最佳,其次是 STFT,所选特征用于咳嗽检测的准确率在 89.17% - 92.67% 之间。
2.3 模型应用
过去有多项使用人工智能对咳嗽声进行肺部疾病分类的研究:
-
超级会员免费看
订阅专栏 解锁全文
21

被折叠的 条评论
为什么被折叠?



