U-Net:用于多疾病检测的多功能深度学习架构
1. U-Net概述及其在医学成像中的适用性
卷积神经网络(CNN)使用卷积层处理图像或视频等空间/时空数据,通过滤波器提取分层特征。这些特征被拼接后输入到下一层,以完成分类或分割等任务,分割即将图像分解为子部分并进行标记。在医学成像中,进行语义分割至关重要,它能为每个像素提供标签,实现对图像的像素级理解,这是医学成像的关键,因为它能轻松区分图像中的不同对象。
U-Net是一种用于对图像或视频帧进行有效语义分割的CNN。如图所示,该CNN呈“U”形,因此得名U-Net,它是一种全卷积神经网络。具有收缩结构的CNN与上采样层相结合,提高了分辨率,收缩路径和扩展路径形成了U形。
收缩结构(编码器)包含一系列卷积 - ReLU - 最大池化操作,减少了空间信息,同时学习上下文,编码器中的通道数量增加,使特征更加丰富。扩展路径(解码器)对空间信息进行上采样,并通过跳跃连接将其与编码器中更高分辨率的特征拼接起来。跳跃连接连接了对应的收缩路径和扩展路径层,保留了空间信息以生成精细细节。网络通过在解码器中设置多个特征通道来传播上下文信息,生成高分辨率的分割图。在解码器的每个上采样阶段,通道数量会减少。
U-Net的中间层(图中的Down conv4)被称为瓶颈层,它具有最高的通道维度,显示出最大的特征丰富度,并能捕获非常高级的信息。U-Net架构非常适合对器官的解剖结构进行分割,已成功应用于各种成像模式,如X射线、CT、MRI和超声,展示了其鲁棒性和灵活性。跳跃连接允许重建图像中的高频内容,增加了图像的丰富度,便于诊断时的图像解释。许多成像模式(如MRI)会生成3D体积,U-Net可以逐片或作为3D体积快速处理。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



