文章目录
DeepLab V2版本实际上我理解不算是一个新版本,而是V1版本的作者们,在V1版本的论文基础上,做了一些完善性的工作之后,提出的一个新的版本,并发表了一篇论文。
论文的题目和V1的论文题目也很类似:《DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs》
从标题中就可以看出来,和V1版本很类似,有空洞卷积(Atrous Convolution)和全连接CRFs(Fully Connected CRFs)。
我理解论文主要的改进或者说贡献在于:
- 在多尺度问题上,引入了金字塔结构,比V1中的更详细具体。
- 以ResNet做了backbone做了比较。
- 在其他两个问题上给出了更形式化,逻辑更清晰的描述。比如对空洞卷积的效率提升给出了具体的计算方法。
其他内容基本和V1版本类似,但我这篇文章还是按照解读论文的方式来写一下这篇论文的内容。
摘要部分
摘要部分开门见山的就提出了论文的三点贡献。
- 空洞卷积在dense prediction任务中(像素级预测任务)可以有效的控制感受野,或者说特征图尺寸(通过空洞率)。而且在扩大感受野的同时不用增加额外的参数和计算量。First, we highlight convolution with upsampled filters, or ‘atrous convolution’, as a po