U-Net论文总结

最新推荐文章于 2025-01-07 10:54:19 发布

原创

最新推荐文章于 2025-01-07 10:54:19 发布 · 530 阅读

2 ·

CC 4.0 BY-SA版权

U-Net简介

$\space\space\space\space\space\space$ U-Net网络是以解决生物医学图像像素级分类（分割）问题为目的提出的网络。论文中提到Ciresan et al. 之前提出的滑窗网络，通过每个像素周围patch的类别来决定像素的类别。所以该网络不仅可以定位（像素分类），而且每个图都有很多patch，这样还增加了训练样本的数量。但是，Ciresan et al.的网络有两个缺陷：
1.每一张图被分成了很多patch，使网络训练\预测时间变长，而且patch之间有很多重叠区域，所以输入到网络中的数据有很多冗余的特征；
2.定位的准确度与上下文信息的使用存在权衡，即如果想要让网络看到更多的上下文信息，就要增大patch，而patch越大，max pooling就越多，这样位置信息丢失的越多，可小patch包含的上下文信息少。
$\space\space\space\space\space\space$ 论文通过全卷积神经网络提出U-Net，网络结构如下图所示。每一次下采样都将通道数扩大两倍，每一次上采样都用2x2的卷积将通道数缩减一半，并连接对应下采样层剪切后的特征图（因为没有padding操作）。
在这里插入图片描述
相比之前的工作，它的改进：
1.上采样部分仍有很多特征图，这样可以将上下文信息更多的传递到像素更高的层；
2.网络中没有全连接层，所以可以将整张图输入网络，获得全图上下文信息；
3.网络中没有使用padding操作，每一层都只包含有效部分。因为没有padding操作，最后输出的分割结果比原图要小，边缘区域会丢失，所以文章提出overlap-tile策略，即将输入图片的边缘区域镜像对称扩大图像尺寸，如下图所示。
在这里插入图片描述
4.因为比赛提供的数据少，所以文章使用了过度的数据增强。
5.分离同一类的挨着的目标物体是一个挑战，所以文章使用了加权loss，即将两个接触着的物体之间的背景赋予很大的权值。权值如下所示
$w(x)=w_c(x)+w_0\cdot exp(-\dfrac{(d_1(x)+d_2(x))^2}{2\sigma^2})$