论文背景
论文全称:FullyConvolutionalNetworksforSemanticSegmentation
论文链接:https://arxiv.org/abs/1411.4038
论文发表时间:2015.3.8
卷积神经网络是高效可视化的模型,能产生特征的层次化结构,针对语义分割问题,本文提出了一个全卷积的神经网络,可以接受任何尺寸的输入,并且产生相应尺寸的输出。结合当前的神经网络(AlexNet, the VGG net, and GoogLeNet)进行微调来应用到分割问题中。
本文找到了 一个新型的神经网络结构:
- 深的、信息粗糙的层的语义信息
- 浅的、信息精细的层的表象信息
突出贡献
- 可以有任意尺寸的输入;
- 利用反卷积(上采样)还原特征映射为输入图片尺寸,进行精确预测;
- 采用跳跃结构,应用到多层信息,使预测更精确。
算法简介
卷积神经网络的应用很广:
- 整张图片的分类;
- 利用结构化的输出提高定位准确度。
– 边界框检测
– 部分/关键点预测
– 局部对应
本文的方法是在每一个像素点上从粗略的信息到精细的信息进行预测,之前的方法都是用神经网络进行语义分割,每一个像素点都被标签为与之相近的目标或区域的类别,但是这一方法有缺陷,会导致储存空间。
本文使用了一个端到端、像素到像素的训