目录
第二部分 Global Attention Block(全局注意力块)
第三部分 Category Attention Block(类注意力块)
前言
最近阅读了 IEEE TRANSACTIONS ON MEDICAL IMAGING(TMI)上的一篇文章:
CABNet: Category Attention Block for Imbalanced Diabetic Retinopathy Grading。即不平衡糖尿病视网膜病变分级的类别注意块。
选取这篇文章的主要原因是糖尿病视网膜病变及使用到了类注意力模块。
一、问题的提出
首先是糖尿病视网膜病变(DR)数据集存在的一些问题:主要是病变区域小和各种等级类别数据量分布不均(分布不均导致网络注重数量多的分类级,而忽视数量少的分类级),如下两图所示,眼底照图片表面病变区域小、饼图表示在三个主要数据集上的分类等级不均,其中0和2类数据集多,1、3、4类少。
二、CABNet网络结构
可以直观地理解为四个部分,即从左到右依次是 backbone, Global Attention Block(全局注意力块), Category Attention Block(类注意力块) 和 classifier(分类器).。其中 全局注意力和类注意力共同组成本文的注意力模型。
第一部分 backbone
- CABNet以一幅眼底图像为输入;
- backbone结构是一个特征提取器(如U-Net的左枝等特征提取器,可以采用在ImageNet 上预先训练好的任意CNNs作为Backbone ),用于获得眼底图像的高级语义特征;
- 从最后一个卷积层提取特征图
,在
上应用1×1卷积层以减少通道数量,得到