论文复现之医学图像应用:视网膜血管分割
0.导语
今日研究为继续上次论文中的一个内容:U-Net网络,于是找了一篇经典论文,并学习论文及代码解读。在学习U-Net网络后,使用U-Net神经网络提取视网膜纹理血管。
1.论文阅读
论文题目:U-Net Convolutional Networks for Biomedical Image Segmentation。
中文翻译为:用于生物医学图像分割的U-Net卷积网络。
1.1 摘要
之前,在训练一个深度网络需要大量已标注的训练样本。在这篇论文中,提出了一种网络和训练策略。为了更有效的使用标注数据,使用了数据扩张的方法。本片论文的网络分为两部分:收缩路径(contracting path)和扩张路径(expanding path)。
收缩路径主要用于捕捉上下文特征
扩展路径用于定位
该网络获得了赢得了ISBI cell tracking challenge 2015。不仅如此,这个网络非常的快,对一个512x512的图像,使用一块GPU只需要不到一秒的时间。
1.2 介绍
卷积神经网络的典型用途是分类任务,其中输出到图像是单个类别标签。 然而,在许多视觉任务中,尤其是在生物医学图像处理中,期望的输出应该包括定位,即:应该将类别标签分配给每个像素。 此外,在生物医学任务中,千量级的训练图像通常难以训练。 因此,Ciresan等人 在滑动窗口设置中训练网络,通过提供围绕该像素的局部区域(补丁)作为输入来预测每个像素的类别标签。
首先,这个网络可以局部化。
其次,补丁方面的训练数据远大于训练图像的数量。
由此产生的网络大幅度赢得了ISBI 2012的EM segmentation challenge。
显然,Ciresan等人的策略 有两个缺点。
首先,它非常慢。
因为网络必须分别为每个补丁运行,并且由于补丁重叠而导致大量冗余。
其次,需要在局部准确性 和 获取整体上下文信息之间取舍。
较大的补丁需要更多的最大池化层来降低局部准确性,而较小的补丁则使网络只能看到很少的上下文。 最近的方法提出了一个分类器输出,它考虑了来自多个层的特征。 良好的本地化和上下文的使用是可能的同时。
在这篇文章中,就建立了一个更加优雅的框架,通常被称为“全卷积网络”(FCN)。随后修改并拓展了这个框架,使其可以仅使用少量训练图片就可以工作,获得更高的分割准确率。网络架构如下图所示:

对FCN中的重要修改是:
上采样部分有大量的特征通道,它们允许网络将上下文信息传播到更高分辨率的层。
使得网络架构中扩张路径与收缩路径基本对称,并产生u形结构。
没有任何完全连接的层,分割图仅包含像素,对于该像素,输入图像中的完整上下文是可用的。
该策略允许通过重叠拼贴策略对任意大的图像进行无缝分割。 为了预测图像的边界区域中的像素,通过镜像输入图像来推断丢失的上下文。 这种平铺策略对于将网络应用于大图像很重要,否则分辨率将受到GPU内存的限制。

在上述谈了,使用少量数据做训练,在这篇论文中也使用了数据增强方法,对于这篇论文中的任务,论文中通过对可用的训练图像应用弹性变形来使用过多的数据增强。
这使得网络能够学习这种变形的不变性,而不需要在注释图像语料库中看到这些变换。 这在生物医学分割中特别重要,因为变形曾经是组织中最常见的变异,并且可以有效地模拟真实变形。 Dosovitskiy等人证明了学习不变性的数据增强在无监督特征学习的范围内的价值。
许多细胞分割任务中的另一个挑战是分离相同类别的触摸物体。

为此,论文中提出使用加权损失:触摸单元之间的分离背景标签在损失函数中获得大的权重。
1.3 网络架构

网络架构如上图所示:它由一条收缩路径(左侧)和一条扩展路径(右侧)组成。
【收缩路径】
收缩路径是典型的卷积网络架构。它的架构是一种重复结构,每次重复中都有2个卷积层和一个pooling层,卷积层中卷积核大小均为3x3,激活函数使用ReLU,两个卷积层之后是一个2x2的步长为2的最大池化层。每一次下采样后我们都把特征通道的数量加倍。
【扩张路径】
扩展路径中的每一步包括对特征映射先进行上采样,然后进行2x2卷积(“上卷积”)。该特征映射将特征通道的数量减半,与收缩路径中相应裁剪的特征拼接起来,以及两个3x3卷积,每个卷积都有一个ReLU。由于每个卷积中边界像素的丢失,裁剪是必要的。在最后一层,使用