CVPR 2017
文章目录
概述
- 要解决的问题
- 实现high-resolution prediction
- 采用的方法
- 自己新设计的一些网络结构
- long range residual connecntions
- chained residual pooling
- 结果如何
- IOU score of 83.4 on PASCAL VOC 2012,state-of-the-art,比当时的最佳DeepLab高很多。
- 在7个公共数据集上state-of-the-art,包括PASCAL VOC 2012, PASCAL-context, NYUDv2, SUN-RGBD, Cityscapes, ADE20K, the object parsing Person-Parts dataset。
- Contributions
- 提出一种多路径精细网络(RefineNet),用细粒度的低级特征递归地对低分辨率语义特征进行细化,以生成高分辨率语义特征图。
- 利用残差的手法进行高效的端到端训练。
- “Chained residual pooling”结构
- 总的来说,论文就是针对如何更好的利用高层语义信息分类和低层信息来产生得到更多细节信息,来产生更高分辨率的预测。
- Related work(一点点综述):
- 早期的分割方法有基于区域建议的,如RCNN。
- 后面提出了FCN型的网络,然后很多就用上了,而且这是一个对于Dens-prediction tasks(语义分割是其中的一种,还有诸如 depth estimation, image restoration, image super-resolution等任务)都比较适用的方法。
- FCN低分辨率预测问题的一些解决:基于空洞卷积的DeepLab-CRF;CRF-RNN基于上面的方法,并实现recurrent layers for end-to-end learning of the dense CRF and FCNN;Deconvolution methods。