利用EdgeMixup提升皮肤疾病分类与分割的性能和公平性
1. 引言
在皮肤疾病的分类和分割任务中,深度学习模型的性能和公平性至关重要。然而,现有的方法往往存在偏差,特别是在处理不同肤色样本时。EdgeMixup是一种新颖的数据预处理方法,旨在通过混合病变边界与原始图像来提高模型性能并减少偏差。
2. 动机
并非所有皮肤疾病数据集都经过精心处理,例如SD - 198包含在不同环境下采集的样本。为了说明EdgeMixup的优势,研究人员训练了两个ResNet - 34模型,一个使用EdgeMixup,另一个不使用。结果表明,EdgeMixup帮助模型更专注于病变区域,而传统诊断方法容易被手指等非病变特征分散注意力。
3. 方法
3.1 模型公平性定义
考虑任何模型$f$(分类模型$f_{class}$或分割模型$f_{seg}$),如果对于给定的指标$M$和来自类别$y$的样本$x_{st1}$和$x_{st2}$($st1$和$st2$根据ITA分数代表不同肤色),有$M(f(x_{st1}), y) > M(f(x_{st2}), y)$,则认为模型对肤色$st2$存在偏差。若存在模型$f$使得$M(f(x_{st1}), y) = M(f(x_{st2}), y)$,则认为该模型对$st1$和$st2$肤色样本完全公平。
3.2 EdgeMixup的组成
EdgeMixup有两个主要组成部分:
- 基于混合的边缘检测
- 下游任务的数据预处理和修改
边缘检测又分为初始边缘检测和迭代改进两个部分:
-