一.主要贡献:
1.提出了一种具有自注意机制的双重注意网络,提高了场景分割中特征表示的能力;
2.提出了位置注意模块来学习特征的空间相关性,提出了通道注意模块来建模通道相关性,通过在局部特征上建模丰富的上下文依赖关系,极大地改善了分割结果;
3. 在Cityscapes dataset , PAS-CAL Context dataset and COCO Stuff dataset这三个数据集上都得到了极佳的结果。
二.整体流程:
1.首先输入一张图像,通过预训练的dilated ResNet输出feature map
(注意:
在最后两个ResNet块中删除了下采样操作并使用了dilated convolutions,从而使最终特征图的大小扩大到输入图像的1/8