摘要
深度卷积神经网络(CNN)在二维医学图像分割方面取得了显著的成功,但由于其复杂的解剖结构等诸多相互影响的挑战,使得CNN从三维医学图像中分割重要的器官或结构仍然是一项艰巨的任务。立体图像中的环境、三维网络的优化难点和训练样本的不足。本文提出了一种新颖、高效的三维全卷积网络,该网络具有三维深度监控机制,可以全面解决这些挑战,我们称之为三维DSN。提出的三维DSN能够进行体对体学习和推理,消除了冗余计算,降低了对有限训练数据过度拟合的风险。更重要的是,三维深度监控机制能够有效地解决三维深度模型训练时梯度消失或爆炸的优化问题,加快收敛速度,同时提高识别能力。这种机制是通过导出一个直接指导网络中上下层训练的目标函数而发展起来的,以便在训练过程中抵消不稳定梯度变化的不利影响。我们还采用一个完全连接的条件随机场模型作为后处理步骤来细化分割结果。我们在两项典型但具有挑战性的容积医学图像分割任务中广泛验证了所提出的3D DSN:(i)3D CT扫描的肝脏分割;(ii)3D MR图像的整个心脏和大血管分割,通过参与MICCAI。在这两个挑战中,我们以更快的速度取得了与最先进方法相竞争的细分结果,证实了我们提出的3D DSN的有效性。
1.Introduction
It is still a difficult task for CNNs to segment objects from 3D medical images owing to the following mutually affected challenges.
First, the 3D medical images have much more complicated anatomical environments than 2D images, and hence 3D variants of CNNs with much more parameters are usually required to capture more representative features.
Second, training such a 3D CNN often confronts various optimization difficulties, such as over-fitting, gradients vanishing or exploding, and slow convergence speed. Third, the inadequacy of training data in many medical applications makes capturing distinctive features and training a deep 3D CNN even harder.
在本文中,我们提出了一种新颖高效的三维CNN,它具有全卷积结构和三维深度监控机制,全面解决了体医学图像分割的这些挑战。我们简称它为3D DSN。
我们的贡献总结如下:
首先,我们开发了一个具有3D反卷积层的3D完全卷积体系结构,以将粗糙特征体积桥接到体素级分割任务的密集概率预测。 该架构能够消除基于块的方法的冗余计算,并实现体积到体积的学习和推理。此外,逐体元误差反向传播大大扩展了训练数据库,从而降低了在有限训练数据上过度拟合的风险。
我们进一步提出了一种三维深度监控机制,通过构建一个直接指导上下两层训练的目标函数,来加强网络内梯度流的阻碍(暂停),从而学习更强大、更具代表性的特征。该机制可以同时加快优化过程,提高模型的识别能力。
我们在两项典型但极具挑战性的容积医学图像分割任务上广泛验证了我们提出的3D DSN:(i)3D CT扫描的肝脏分割;(ii)3D MR图像的心脏和大血管分割,通过参与两项著名且有影响力的挑战:证明了所提出的三维DSN的有效性和泛化能力。
2.Related work
2.1 用于体积结构分割的CNNs
基于cnn的体积医学图像分割算法可以大致分为两类,即,基于二维CNN和基于三维CNN的方法。
基于二维CNN的方法通常是逐片分割体积CT或MR数据。
几个三维的体到体分割网络,包括3D U-Net (Cicek et al., 2016)、V-Net (Milletari et al., 2016)、I2I-3D (Merkow等,2016)和VoxResNet (Chen等,2017)。
3D U-Net将2D U-Net扩展为3D版本,其具有抽象特征的分析路径和产生全分辨率分割的合成路径。 在分析和合成路径中在相等分辨率的层之间建立快捷连接。
V-Net将架构划分为多个阶段并整合了剩余连接。 V-Net接受了基于新的基于Dice系数的目标函数的训练,以处理分类不平衡情况。
VoxResNet深刻借鉴了2D深度残差学习的精神(He et al。,2016),构建了一个非常深的3D网络。 进一步利