基于深度学习的医学图像分割(三)UNet++: A Nested U-Net Architecture for Medical Image Segmentation

本文介绍了UNet++网络,它通过重新设计的跳跃路径和深度监督机制,提升了医学图像分割的精度和效率。通过密集的卷积块和多尺度特征融合,UNet++在参数量减少的情况下仍保持良好性能。实验对比了UNet++与UNet和wideUNet,展示了其在不同医学数据集上的优势和模型剪枝的可能性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


原文链接
作者解读

一.UNet++网络架构

在这里插入图片描述

UNet++与UNet相比re-designed skip pathways(图中绿色和蓝色部分)且运用了deep supervision(图中红色部分)。

Re-designed skip pathways

UNet网络并不是越深越好,不同数据集的最优深度是不一样的。给定一个新的数据集,并不知道多深的网络是最优的,因此,需要设计一个网络使得它能够学习不同深度特征。如下图所示,可以在这个网络里面找到1~4层的U-Net,这样做的好处是不管哪个深度的特征有效,全部包含在网络中,让网络自己去学习不同深度的特征的重要性。同时,该网络共享了特征提取器,不需要训练大量的UNet,而是只训练一个encoder,它的不同层次的特征由不同的decoder路径来还原。然而上述网络是不能训练的,因为不会有任何梯度经过红色区域。

在这里插入图片描述
为解决网络不能训练的问题,将网络结构进行redesign,如下图所示。将网络中的长连接替换成了一系列短连接,然而长连接是非常必要的,它联系了输入图像的很多信息,有助于还原降采样所带来的信息损失。
在这里插入图片描述
因此,提出了既包含长连接又包含短连接的网络结构。将原来空心的UNet填满,抓取不同层次的特征,将它们通过特征叠加的方式整合。这种Redesign改变了编码和解码子网络的连接性。密集的卷积块使编码器的feature map和解码器的feature map在语义级别相似。假设当接收到的编码器的feature map和相应的解码器的feature map在语义上相似时,优化器将更容易进行优化。
在这里插入图片描述

用公式表示skip pathways:函数H(·)表示卷积操作,且紧跟着一个激活函数;U(·)表示一个上采样层,[ ]表示连接层。j=0的节点从编码器的前一层只接收一个输入,j>1的节点共接收j+1个输入。
在这里插入图片描述

Deep supervision

深度监督使模型可在两种模式下运行:(1)精确模式:最终输出是所有分割分支的输出平均。(2)快速模式:最终的分割图只能从分割分支中选择一个。
(1)整合不同层次的特征,精度提升。
(2)灵活的网络结构配合深监督,在可接受的精度范围内可利用剪枝大幅度缩减参数量。

实现深监督的具体操作是在每个目标结点X0,1,X0,2,X0,3,X0,4后加一个1×1的卷积核followed by a sigmoid activation function,将二元交叉熵和Dice系数的组合作为损失函数添加到四个语义层次中的每一个,监督每一个分支的输出。
在这里插入图片描述

这种深监督带来了一个优势: 剪枝。

为什么剪枝???
在深监督过程中,每个子网络的输出均是图像的分割结果,所以如果小的子网络的输出结果已经足够好了,便可以剪掉网络多余的部分。
在测试阶段,由于输入的图像只会前向传播,剪枝之后对前面的输出无任何影响,而在训练阶段,因为既有前向传播又有反向传播,被剪掉的部分可以帮助其他部分更新权重,如果直接拿L1,L2,L3训练,就相当于只训练了不同深度的U-Net,最后的结果会很差。即在测试阶段剪掉的部分对剩余结构不做影响,在训练阶段,剪掉的部分对剩余部分有影响。因此,可以在测试的时候剪枝,根据验证集的结果觉得剪枝多少。
在这里插入图片描述
在(a)(/c)(d)三个数据集中,L2的结果和L4非常接近,而L2的参数量为0.5M,L4的参数量为9M,模型的内存可以省下18倍。

在这里插入图片描述

二.UNet++优势(对比UNet)

(1)跳跃路径上的卷积层,使编码器的feature map和解码器的feature map在语义级别相似。
(2)跳跃路径上有密集的skip-connection,改善了梯度流。
(3)使用deep-supervision,可以进行模型修剪和改进。

三.Experiments

使用了四种医学图像数据集对UNet++进行评估,并与UNet和wide UNet(强行增加U-Net里面的参数量,增加其每层卷积核个数得到)的表现对比。

**为什么用wide UNet??因为unet++相比unet参数多,为证明并不是无脑增加参数量,模型效果就会好,在设计时使wide unet的参数比unet++稍微多一点。
四种医学图像数据集:小剂量的CT胸透扫描瘤分割、显微镜里的细胞核分割、腹部CT的肝脏分割以及结肠息肉分割

实现细节

监控Dice系数和Intersectionover Union (IoU),并在验证集上使用了提前终止机制。
使用了Adam optimizer,学习率为3e-4。
沿着skip pathway的卷积层使用大小为3×3(3D肺结节分割使用的是3×3×3)的k个kernel,其中k=32×2i
为实现Deep supervision,在每个目标结点上附加一个1×1的卷积层和一个sigmoid激活函数。
最终,对于给定的一个输入图像,UNet++生成四个分割图,将四个分割图进一步平均,得到最终的分割图。

四.Result

在这里插入图片描述

### FCN、U-Net 和 U-Net++ 的网络结构概述 #### Fully Convolutional Network (FCN) Fully Convolutional Networks (FCNs) 是一种经典的语义分割模型,其核心思想是通过卷积操作替代传统的全连接层,从而实现端到端的像素级预测。FCN 的主要特点是引入了跳跃连接(skip connections),将高层特征图与低层细节丰富的特征图相结合,以恢复空间分辨率并提高分割精度。 以下是 FCN 的典型网络结构特点: - 输入图像经过一系列下采样操作提取高层次特征。 - 使用反卷积(Deconvolution 或 Transposed Convolution)逐步上采样得到最终的分割掩码。 - 跳跃连接将不同层次的特征图融合,增强边缘细节的表现力。 ```plaintext Input -> Encoder (Conv Layers, Pooling) -> Decoder (Upsampling/Transposed Convolutions) -> Output ``` 尽管无法直接展示图片,但可以通过查阅经典论文《Fully Convolutional Networks for Semantic Segmentation》获取详细的架构图[^4]。 --- #### U-Net U-Net 是一种专为生物医学图像分割设计的经典编码器-解码器架构。它的名称来源于其形状类似于字母 “U”。具体来说: - **编码器路径**:由多个卷积层和最大池化层组成,负责逐层降低输入的空间维度,同时增加通道以捕获更深层次的特征。 - **瓶颈层**:位于中间位置的一系列卷积操作,用于进一步压缩特征表示。 - **解码器路径**:通过对称的上采样操作逐渐恢复原始尺寸,并通过跳过连接将高分辨率特征重新融入当前上下文中。 U-Net 的独特之处在于它利用了跨层连接机制,在每次上采样的过程中都将来自编码阶段的信息传递给对应的解码阶段,这极大地提高了边界区域的准确性[^2]。 ```plaintext Input -> Down-sampling Path (Convs & MaxPoolings) -> Bottleneck Layer -> Up-sampling Path (Transpose Convs & Skip Connections) -> Output ``` 关于具体的可视化图表,可参考原版论文《U-Net: Convolutional Networks for Biomedical Image Segmentation》,其中清晰展示了整个流程及其组件布局[^5]。 --- #### U-Net++ 作为 U-Net 的扩展版本,U-Net++ 提出了嵌套式的架构设计理念,旨在加强多尺度特征之间的交互作用。相比于传统单向传播模式下的简单拼接方式,新方案构建了一个更加密集互联的关系网路体系结构。每层内部不仅存在横向短距离联系而且还具备纵向长程依赖关系,这样做的好处是可以让浅层局部纹理信息更好地指导深层全局结构理解过程,进而提升整体性能表现水平。 具体而言,U-Net++ 主要做了如下改动: 1. 增加额外的跳跃连接形式,形成复杂的金字塔状拓扑; 2. 利用 Dense Block 替代普通的双次插值方法完成尺寸匹配任务; 3. 强调各子模块间协作效应最大化原则的应用实践价值所在之处体现得淋漓尽致。 因此,如果想深入了解这一改进型框架的具体形态,则建议阅读相关资料比如《UNet++: A Nested U-Net Architecture for Medical Image Segmentation》这篇文章里附带的相关图形说明材料会很有帮助[^1]。 ```plaintext Nested Structure with Multiple Levels of Feature Fusion via Dense Blocks and Enhanced Skip Connections. ``` --- ### 总结对比表 | 特性 | FCN | U-Net | U-Net++ | |-------------------|------------------------------|------------------------------|-----------------------------| | 架构类型 | 编码器-解码器 | 编码器-解码器 + 跨越连接 | 多重嵌套编码器-解码器 | | 据流方向 | 单向 | 双向(跨越连接辅助) | 高度互连 | | 应用领域 | 广泛适用 | 生物医学为主 | 更高级别的医疗影像分析 | 以上是对种主流分割算法各自特性的总结归纳,希望对你有所帮助! ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值