基于Choquet模糊集成的Efficient - Nets皮肤癌分类方法
1. 研究背景与动机
卷积神经网络(CNN)在分析皮肤镜图像方面具有很大潜力。此前有研究者利用不同数据集和CNN架构开展了相关研究,如Li和Shen使用ISIC2017数据集,提出包含两个全卷积残差网络(FCRN)和一个简单CNN的深度学习框架,分别用于病变分割、病变分类和病变皮肤镜特征提取任务;Kassani和Kassani使用ISIC2018数据集分析了几种先进的卷积神经网络性能,并选择ResNet50作为皮肤镜图像分类的最佳CNN。
受CNN在近期研究中的有效性以及分类器集成技术可提高分类准确率的启发,我们设计了一种新颖的架构,用于基于ISIC2018、ISIC2019和ISIC2020数据的八类皮肤癌分类任务。该架构主要有以下两个贡献:
- 提出基于Macro - F1分数的奖励函数算法,用于训练基础分类器(特别是Efficient - Nets),使模型对类别不平衡数据更具鲁棒性。
- 提出基于Choquet模糊积分的基础分类器集成方法,利用每个分类器的概率输出进行最终预测。
2. 数据集
本研究使用的数据集来自ISIC Archive,我们从Kaggle(SIIM - ISIC黑色素瘤分类)下载。该数据集包含ISIC2018、ISIC2019和ISIC2020的皮肤镜图像,共计57964张,其中25272张来自ISIC2018 - 19,32692张来自ISIC2020。我们使用这些图像的JPEG版本,统一尺寸为512 × 512。
数据集分为八种不同类型的皮肤癌:黑色素瘤(MEL)、黑素细胞痣(NV)、基底细胞癌(BCC)、光化