论文名称:Fully Convolutional Networks for Semantic Segmentation
论文地址:https://arxiv.org/pdf/1411.4038.pdf
代码地址:https://github.com/shekkizh/FCN.tensorflow
语义分割是指对图像进行像素级别的分类,即标注出图像中每个像素所属的类别。
这篇论文是语义分割算法的开山之作,作者提出了:
(1)将全连接层替换为卷积层的end-to-end的全卷积网络,可以适应任意尺寸的输入,在不破坏空间结构的基础上,可以对图像进行像素级别的分类。
(2)一种跳跃结构,也就是将不同池化层的结果进行上采样,可以得到更为精细的输出。
一、论文解读
1、CNN与FCN
CNN网络在卷积层之后会接上若干个全连接层, 将卷积层产生的特征图映射成一个固定长度的特征向量,softmax归一化后表示输入图像属于每一类的概率。

本文详细解读了FCN(全卷积网络)在语义分割领域的开创性工作,包括将全连接层替换为卷积层以适应任意尺寸输入,以及采用跳跃结构提高分割精度。此外,还探讨了FCN的缺点及其在实际应用中的实现方式,如损失函数和网络结构设计。
最低0.47元/天 解锁文章
646

被折叠的 条评论
为什么被折叠?



