基于胸部X光图像的COVID - 19和肺炎检测:应对类别不平衡问题
1. MobileNet - V2模型概述
在胸部X光图像(CXR)的分析中,MobileNet - V2模型展现出了独特的优势。与传统的卷积神经网络(CNN)模型相比,它在减少超参数数量方面表现出色。例如,若最后卷积层输出的图像张量大小为7 × 7 × 1280,全连接层(FC层,在此为全局平均池化层GAP)的输入神经元数量仅为1280,而非传统情况下的62,720。这使得MobileNet - V2模型在第一个FC层就能显著减少超参数数量,从而在完成复杂任务时,有效避免过拟合问题。我们将预训练的MobileNet - V2模型应用于不平衡的CXR数据集,后续会在结果分析部分深入探讨其表现。
2. CXR数据集中的类别不平衡问题及解决方法
类别不平衡是计算机视觉和医学图像诊断中常见的问题。医学领域的大多数现有数据集都存在明显的不平衡,即某一类别的图像数量远多于其他类别。这种不平衡会导致传统CNN模型将少数类别的图像误分类为多数类别。为解决这一问题,研究者们提出了多种方法,主要可分为重采样方法和修改损失函数两类。
2.1 重采样方法
- 欠采样 :随机丢弃多数类别的图像,使各类别图像数量相近。但对于高度不平衡的数据集,这种方法不可行,因为大量丢弃图像会降低数据集的挑战性,还可能丢失重要特征。
- 过采样 :
- 数据增强 :通过旋转、水平和垂直翻转等线性变换在少数类别中生成合成图像,减少类别不平
超级会员免费看
订阅专栏 解锁全文
1127

被折叠的 条评论
为什么被折叠?



