※ 这是学习 B站博主霹雳吧啦Wz 的 深度学习-语义分割篇-UNet网络结构讲解视频 所做的笔记。
论文名称:U-Net: Convolutional Netorks for Biomedical Image Segmentation
发布时间:2015年
论文地址:https://arxiv.org/abs/1505.04597
这篇论文是针对生物医学影像领域提出的,所以一提到UNet,我们很容易就想到医学影像。
关于 UNet 网络结构:
UNet是一个 Encoder-Decoder 的结构(编码-解码)。
Encoder 对应的是我们这个U型结构的左半部分,也就是我们特征提取以及下采样的部分。
Decoder 就是右半部分,经过一系列的上采样,最终得到一个分割图。
在论文当中,对于我们左边这一侧的叫做 contracting path (收缩路径),右边这一侧叫做 expanding path (扩张路径)。
在这张图中,每一个长条矩形对应的都是一个特征程,每一个箭头都是一种操作(操作类型在图的右下角)。
1. 网络结构讲解
我们从输入开始看:
这里是以572×572的单通道的图像为例(说单通道的原因在于第一个长