一、前言
截止到2020.12.10.17:01:56 从谷歌学术上查询到U-Net被引用次数为20619
2015年发表U-Net的MICCAI,是目前医学图像分析领域最顶级的国际会议。该论文第一单位是德国的费莱堡大学。
二、U-Net结构
看到这个结构的第一眼,感觉很优美,不过也很复杂,里面有很多细节问题需要深入了解,
实际上,把U-Net进行简化,可以用下图表示:
从上图中可以看到,简化之后的U-Net的关键点有三条线:
- 下采样编码
- 上采样解码
- 跳跃连接
下采样进行信息浓缩和上采样进行像素恢复,这是其他分割网络都会有的部分,U-Net自然也不会跳出这个框架,可以看到,U-Net进行了4次的最大池化下采样,每一次采样后都使用了卷积进行信息提取得到特征图,然后再经过4次上采样恢复输入像素尺寸。
但是,U-Net最关键的、也是最特色的部分在于图中红色虚线的Skip Connection。每一次下采样都会有一个跳跃连接与对应的上采样进行级联,这种不同尺度的特征融合对上采样恢复像素大有帮助,具体来说就是高层(浅层)下采样倍数小,特征图具备更加细致的图特征,底层(深层)下采样倍数大,信息经过大量浓缩,空间损失大,但有助于目标区域(分类)判断,当high level和low level的特征进行融合时,分割效果往往会非常好。
总的来说U-Net在医学图像上效果优越,是由U-Net网络结构和医学图像本身特征所决定的。
- U-Net的带有跳跃连接的编解码结构能够融合不同层级的特征,
- 医学图像本身的固定化结构和小样本性,共同使得U-Net成为医学图像分割领域的最佳模型。
今天就说这么多,拜拜啦。感谢您的关注!
参考
https://mp.weixin.qq.com/s/WQxF97j4KBNYeG2wudZ8_w 【深度学习100问-16:为什么U-Net在医学图像上表现优越?】