虽然本人目前的方向是图像增强,但是个人感觉还是要多了解别的方向的东西,有些思路可以借鉴到后面的工作中。这里简要参考别人的博客来了解一下常见的图像分割网络的结构和原理。
FCN
这是最早用来做分割的网络了。FCN的原理就是,将传统的CNN用于分类的全连接层转换成卷积层,具体操作是将最后的全连接层变成核大小为1的卷积层,即卷积核的大小(通道数,宽,高)分别为(4096,1,1)、(4096,1,1)、(1000,1,1)。如下图所示:

将图像转换成feature而不是全连接层,更有助于获得每个feature上位置的类别信息。因为没有全连接操作,所以这里称为全卷积网络。经过多次卷积和池化之后,得到的feature已经很小了,这里通过反卷积的方法进行上采样,获得原来的尺寸大小。具体来说,就是原图像分辨率在多次卷积池化之后,尺寸分别缩小为原来的2,4,8,16和32倍。对最后一层图像做32倍上采样,就可以得到和原图一样的大小。
由于最后进行32倍下采样损失的细节太多,所以上采样得到的原图不够精细,这里作者还将16倍和8倍的输出也进行反卷积,如下图所示:

在具体进行操作时,FCN16s是将32倍下采样的结果和两倍上采样和16倍下采样的结果1x1卷积后相加,然后再放大16倍。FCN-8s的结果是将上述相加的结果进行两倍上采样再和8倍下采样的结果相加,然后再放大8倍。具体如下图所示:
</