眼科图像分析与处理:多尺度池化、正则化及质量增强方法
1. 多尺度全局平均池化(Multi-scale Global Average Pooling)
全局平均池化(GAP)不仅能减少全连接层的参数,还能充分利用空间信息。但由于视网膜色素变性(RP)病变的分布和大小各异,判别特征的尺寸缩小到难以生成具有准确空间信息的病变激活图(LAM)。因此,引入了多尺度全局平均池化(MS - GAP)来有效聚合病变的多尺度全局特征。
1.1 多尺度特征聚合步骤
- 调整特征尺寸 :将所有特征调整为相同大小。
- 生成特征向量 :使用GAP生成三个尺度的特征向量。
- 拼接特征向量 :将生成的特征向量进行拼接。
1.2 相关公式
对于给定的特征图,设 $f_{ki}(x, y)$ 表示第 $i$ 个尺度特征单元 $k$ 在空间位置 $(x, y)$ 的激活值。
- 使用GAP处理尺度 $i$ 的特征单元 $k$ 的结果为:$F_{ki} = \sum_{x,y} f_{ki}(x, y)$
- 对于给定类别 $c$,输入到softmax层的分类得分可表示为:$S_c = \sum_{i} \sum_{k} w_{c}^{ki} \sum_{x,y} f_{ki}(x, y)$
- 分类目标可以用标准分类损失函数表示:$L_{cls} = - \sum_{D} l \cdot \log S_I$
- 病变激活图 $M (x, y)$ 可