【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf
文章目录
DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs
深度学习解决了语义图像分割的任务
做出了三个主要贡献,这些贡献在实验中被证明具有实质性的实际价值
-
强调卷积与上采样滤波器,或“空洞卷积”,作为一个强大的工具在密集预测任务
作用:卷积实现不增加参数数量或计算量的情况下有效地扩大过滤器的视野,以纳入更大的上下文**
-
空间金字塔池(ASPP)的多尺度目标鲁棒分割方法
作用:在多个尺度上捕获对象和图像上下文
-
结合DCNNs和概率图模型的方法,改进了目标边界的定位
作用:条件随机场(CRF)相定性和定量地展示了定位性能
提出的DeepLab系统在PASCAL VOC -2012语义图像分割任务
一、介绍
以端到端方式训练的DCNNs比依赖手工制作特征的系统提供了明显更好的结果
DCNNs对局部图像变换的内置不变性,这使得它们能够学习越来越抽象的数据表示
可能会妨碍语义分割等密集的预测任务,因为在这些任务中不需要对空间信息进行抽象
DCNN应用于语义图像分割的三个挑战:
- 特征分辨率降低
- 多个尺度上存在目标
- 由于DCNN的不变性而降低了定位精度
当DCNN以完全卷积的方式使用时,这将导致显著降低空间分辨率的特征图
DCNNs的最后几个最大池化层中去除下采样算子,并在随后的卷积层中对滤波器进行上采样
采用空洞卷积作为上采样滤波器卷

DeepLab通过深度卷积网络、空洞卷积和完全连接的条件随机场(CRF)提升语义图像分割性能。它解决了分辨率降低和定位精度问题,采用空间金字塔池处理多尺度,CRF则用于精确边界恢复。实验结果显示DeepLab在PASCALVOC-2012上表现优异。
最低0.47元/天 解锁文章
8607






