摘要:
1.使用artous卷积,在不增加参数的情况下增加 the field of view of filters。
2.提出ASPP,在多尺度上分割物体
3.impore the localization of object boundaries ,通过结合DCNN和probabilistic graphical.
DCNN应用于语义分割有三个困难:
1. 降低特征的分辨率
2. 多尺寸目标的存在
3. invariance 降低 localization 准确率
第一个困难,移除了DCNN最后几层max pooling 层的下采样操作,并且对之后所有的卷基层upsample the filters.
使用artous convolution recover了full resolution feature maps.
第二个困难,通常是对图片进行多尺度变换,但是这样会增加计算负荷,使用artous spatial pyramid pooling(ASPP).
第三个困难,采用skip-layers方法也可以,但是我们使用CRF,使用fully-connected CRF,可以取得fine edge detials.
整个model
将VGG-16 or ResNet-101对于分类任务的模型做一些改变
1. 将全连接层变成卷积层
2. 通过atrous convolution 提高feature resolution
3. 之后employ 双线性差值上采样到原始图片的resolution,之后输入到CRF
artous convolution