常见的图像分割网络了解（上）

最新推荐文章于 2025-06-09 18:10:53 发布

CHNguoshiwushuang

最新推荐文章于 2025-06-09 18:10:53 发布

阅读量6.9k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习

本文链接：https://blog.youkuaiyun.com/CHNguoshiwushuang/article/details/81435499

本文简要介绍了两种经典的图像分割网络——FCN和Segnet。FCN利用全卷积层进行上采样，通过不同倍率的上采样层组合以提高精细化程度。Segnet则采用最大池化层的索引进行无学习的上采样，以保持空间细节和减少训练参数。这两种方法在图像分割领域具有重要意义。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

虽然本人目前的方向是图像增强，但是个人感觉还是要多了解别的方向的东西，有些思路可以借鉴到后面的工作中。这里简要参考别人的博客来了解一下常见的图像分割网络的结构和原理。

FCN

这是最早用来做分割的网络了。FCN的原理就是，将传统的CNN用于分类的全连接层转换成卷积层，具体操作是将最后的全连接层变成核大小为1的卷积层，即卷积核的大小(通道数，宽，高)分别为（4096,1,1）、（4096,1,1）、（1000,1,1）。如下图所示：

将图像转换成feature而不是全连接层，更有助于获得每个feature上位置的类别信息。因为没有全连接操作，所以这里称为全卷积网络。经过多次卷积和池化之后，得到的feature已经很小了，这里通过反卷积的方法进行上采样，获得原来的尺寸大小。具体来说，就是原图像分辨率在多次卷积池化之后，尺寸分别缩小为原来的2,4,8,16和32倍。对最后一层图像做32倍上采样，就可以得到和原图一样的大小。
由于最后进行32倍下采样损失的细节太多，所以上采样得到的原图不够精细，这里作者还将16倍和8倍的输出也进行反卷积，如下图所示：