全卷积网络:
个人认为本文主要是两个重点:
第一是fcn,全卷积网络(+上采样)
第二是skip net
首先说全卷积网络:
通常cnn在卷积层后会接上若干全连接层,但是全连接层和卷积层的连接数量是固定的,这也就导致了输入必须是固定的尺寸。如下图所示:
但是在fcn中将fc用卷积取代,再加上采样层,这样能够输入任何大小的图片,同时输出图片相应大小的语义分割。如下图所示:
可以看到两站图中的红色部分略有不同,这是因为第一幅图中通过全连接层,已经破坏了卷积层输出feature map的空间结构,而第二幅图中通过全卷积网络保持了feature map空间结构,在通过反卷积完全可以恢复原图像中目标的空间位置,也成为heat map。从下图中可以看出heat map中的标记与原图中cat的位置相似。