目前,基于区域的方法主要分为两类:任务解耦和的RCNN[1]和任务高度耦合的FCN[2]。
RCNN是将任务分解,目标检测、定位与分割依次逐一进行,前者决定后者的输入,因此称为任务解耦和。而FCN则将三类任务在一个网络中同时进行,不分先后,任务高度耦合。FCN已在医学图像领域有很多表现优异的衍生网络,如U-NET[12]等,而RCNN则应用较少。
1全卷积网络FCN
1.1FCN
用于图像分割的全卷积网络区别于其他网络最大的特点就是,可以接受任意大小的输入并产生相同大小的像素级分割结果,这一特性是由于它用卷积层代替了全连接层带来的,解除了全连接对输入大小的要求。并通过上采样+跳跃连接的形式来弥补池化下采样所造成的大小和信息损失,保持输入输出大小一致。
不过,FCN更适合于目标检测定位后的局部图像块的分割,并不适合大场景多目标的检测分割。同时,FCN可以看作基于网络最深层的分类结果,借助低层特征的信息填充进行上采样的过程,并没有改变特征提取的过程,只是在分类器层面进行了修改。因此,大多流行的分类网络,如VGG[13]和GoogleNet[14],可以很容易的转化成全卷积的结构。因此,通过调优现有的优秀网络模型可以较为方便的获取FCN。
图1FCN网络结构
1.2U-Net
深层卷积神经网络训练需要大量样本,而医学图像并不具备这一条件,因此,U-Net在FCN的基础上进一步提高了数据利用效率,并提出了一种对称的网络结构,用对称的上采样弥补下采样所损失的信息。
图2U-Net