【论文阅读笔记】U-Net: Convolutional Networks for Biomedical Image Segmentation

U-Net是一种用于生物医学图像分割的卷积神经网络,它能在有限的数据集上实现高效训练。该网络采用端到端的方式,直接输入原始图像并输出分割后的图像。U-Net结合了收缩和扩张路径,利用数据增强技术和GPU加速训练过程,适用于医疗图像等小规模数据集。此网络在2015年的ISBI细胞轮廓分割挑战赛中取得了优异的成绩。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

>  大意是说 ,普遍认为深度网络需要大量已标签数据集,这个网络(U-Net)可以依靠数据增强来事先少量数据集训练网络。而且,这个网络训练得很快,运用GPU运行,512*512的图片只需要不用一秒即可。   该网络属于端对端网络,即输入图片,输出分割开的图片。赢得了2015年ISBI竞赛。

介绍

>  卷积神经网络已经存在很久了,但因为缺少可用的训练数据集而没被大量使用,直到ImageNet数据集(百万张图片)的出现。   传统的卷积网络的目标是分类,即对每个图片给予一个标签。但是对于很多视觉任务,特别是医疗图像方向,目标应该包括定位,以及对每个像素块给予一个标签。而且,医疗图像的训练集都不大。 >  大概也就介绍了一些传统的图像分割算法,如滑动窗口,以及U-Net借鉴的前身FCN之类的,并为比较难的分割的情况(彼此接触的同类物体)提议了一种方法。

网络架构

![U-Net](https://img-blog.csdnimg.cn/img_convert/0578a8b35ae1b87e636ba78f5c0aa5d9.png) >  网络架构就如上图,可以描述为由收缩路径(左边)和扩张路径组成。**收缩路径**和传统的卷积网络一样,由卷积核尺寸为$3*3$的无填充卷积,每次卷积后都经过ReLU函数作用,以及尺寸为$2*2$,步距为2的最大池组成。这个最大池化就是下采样的过程,下采样后就将channels变为2倍。**扩张路径**由$2*2$的上卷积,上卷积的output channels为原先的一半,再与对应的特征图(裁剪后)串联起来(得到和原先一样大小的channels),再经过两个尺寸为$3*3$的卷积及经过ReLU作用。**相应的裁剪特征图是必须的,因为在我们卷积的过程中会有边界像素的丢失。**在最后一层通过卷积核大小为$1*1$的卷积作用得到想要的目标种类。在这个网络中,有23个卷积层。 >  为了保证输出分段映射的无缝拼接,需要谨慎的选择输入图片的尺寸,以保证所有的Max Pooling操作应用于有偶数的x-size和偶数的y-size的图层。

训练

>  该论文是基于Caffe,使用动量为0.99的SGD,损失函数为交叉熵,训练输入图片与它们对应的分割图片(输入图片和最后的图片的尺寸不一样)。该训练模型和传统的训练模型没什么不同,都是注意权重初始化随机,数据增强等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值