目录
Title:UTNet: A Hybrid Transformer Architecture for Medical Image Segmentation.
Title:UTNet: A Hybrid Transformer Architecture for Medical Image Segmentation.
Abstract--摘要
本文提出的UTNet将自注意力集成到卷积神经网络当中,用于增强医学图像的分割。UTNet在编码器和解码器模块应用自注意模块,以最小的开销捕获不同尺度下的长距离依赖性(长距离依赖性指的是在NLP领域一些文字的翻译,需要一些其他元素来补充使得意思完整,而这个需要词汇填充的位置和它们的填充物--这个填充物指的是能够推断出该词汇的语料。在空间上相距甚远。这就是所谓的长距离依赖性。)
本文提出了一种有效的自注意力机制和相对位置编码,还提出了一种新的自注意力解码器,用于从编码器中的跳跃连接中恢复丢失的细节信息。
Introduction
尽管卷积神经网络在医学图像分割领域中取得了很多的进展,但是这一固定的格式存在着两个固有的局限性。首先卷积仅从邻域像素收集信息,缺乏显式捕获长距离相关性的能力。其次,卷积核的大小和形状通常是固定的,因此它们无法适应输入内容。Transformer能够捕获长距离关联特征。它允许网络基于输入内容动态的聚合相关特征。
在本文中提出了一种U型混合变换网络:UTNet。这种方法集成了卷积强度和自关注策略。主要目标是应用卷积层来提取局部强度特征,以避免Transformer的大规模预训练,同时使用自注意力机制来捕获长距离关联信息。