TransDeepLab:用于医学图像分割的无卷积Transformer深度网络
1 引言
自动且准确的医学图像分割,即对解剖结构和其他感兴趣区域(ROIs)进行自动描绘,在计算机辅助诊断(CAD)评估中起着不可或缺的作用。作为深度学习的旗舰,卷积神经网络(CNNs)多年来在各种医学图像分割任务中取得了显著成果。
在众多CNN变体中,被广泛认可的对称编码器 - 解码器架构U-Net展现出卓越的分割潜力。它主要由一系列连续的卷积和下采样层组成,通过收缩路径捕获上下文语义信息。然后在解码器中,利用编码器的横向连接,对粗粒度的深层特征和细粒度的浅层特征图进行上采样,以生成精确的分割图。沿着这一技术路线,许多U-Net变体如U-Net++和Res - UNet应运而生,以提高分割性能。然而,这类架构的一个重要缺陷是感受野大小受限,这使得深度模型无法捕获足够的上下文信息,导致在复杂区域(如边界)的分割失败。
为缓解这一问题,著名的DeepLab工作被提出,引发了图像分割领域的广泛关注。作者做出了重要贡献,实验证明具有显著的实际价值。首先,他们引入了一种名为“空洞卷积”的新型卷积操作,该操作允许扩大滤波器的视野,以吸收更大的上下文信息,而不会增加大量的计算负担或参数数量。其次,为了引入平滑项,使网络能够捕获精细细节,他们利用全连接条件随机场(CRF)来细化分割结果。在此开创性工作之后,扩展版本被用于进一步提升性能。例如,DeepLabv2被提出以应对多尺度物体存在的挑战,为此,他们提出了空洞空间金字塔池化(ASPP)模块,以稳健地分割多尺度物体。随后,DeepLabv3设计了一个带有空洞卷积的编码器 - 解码器架构,以获得更清晰的物体边界,其中利用了深度可分离卷积来提高计算效率。最终,Che
超级会员免费看
订阅专栏 解锁全文
2233

被折叠的 条评论
为什么被折叠?



