Attention U-Net
2018 CVPR
Ozan Oktay, Jo Schlemper, Loic Le Folgoc, Matthew Lee
Attention U-Net: Learning Where to Look for the Pancreas
1、Introduce
什么是attention?
Attention 即为注意力机制,举例就是在复杂场景文字识别中,使用Attention把注意力集中在需要识别的数字上。
在医疗图像中,就是把注意力集中到对特定任务有用的显著特征(比如说相关组织或者是器官),抑制输入图像中的不相关区域。在级联神经网络中,需要明确的外部组织/器官定位模块,而使用Attention就不需要了。
论文中是以U-net为基础进行集成,在decoder部分使用了Attention Gates ,得到了Attention U-Net模型。实验表明,融入AG后,Unet模型的精度更高了。
本文提出的 Attention
- 提出了grid-based gating ,使attention coefficients 更具体到局部区域。
- 在一个 feed-forward CNN模型中使用soft-attention技术
提出的attention gate可以替代图像分类中使用的注意方法和图像分割框架中使用的外部器官定位模型。 - 提高模型对 foreground 像素的敏感度
FCN (Fully Convolutional Network) 优于传统方法是因为:
(I) 利用随机梯度下降(SGD)优化学习域特定图像特征
(II) 学习的核在所有像素之间共享
(III) 图像卷积操作很好地利用了医学图像中的结构信息
cascaded CNNs方法:
- an initial coarse-level model (e.g. U-Net or Regression Forest) is used to obtain a ROI
- then a cropped ROI is used for segmentation refinement by a second model.
- dense connections
- sparse convolutions