Rethinking Atrous Convolution for Semantic Image Segmentation
https://arxiv.org/abs/1706.05587v1
代码还没开源
本文主要还是在DeepLab 基础上进一步完善。一个是加入 Multigrid ,第二个是改进 Atrous Spatial Pyramid Pooling,加入 image-level features encoding
global context
在代码实现和训练时加入比较多的技巧
Atrous Convolution 是什么啊
这里给出了针对获取多尺度信息的 四个框架
Going Deeper with Atrous Convolution
Cascaded modules without and with atrous convolution
改进版的 Atrous Spatial Pyramid Pooling
不同 output stride 的效果
在训练中 Bootstrapping 还是比较有用的
Performance on PASCAL VOC 2012 test set
Visualization results on the val set when employing our best ASPP model. The last row shows a failure mode

本文基于DeepLab提出改进措施,包括引入Multigrid及改进空洞空间金字塔池化(ASPP),加入图像级特征编码全局上下文。通过多种技巧提升模型效果,并详细探讨了不同输出步长的影响。
675

被折叠的 条评论
为什么被折叠?



