图像识别技术与应用课后总结(21)

U - net

整体结构与原理:是编码解码过程 。通过一系列卷积(conv 3x3、conv 1x1 )、ReLU激活函数、最大池化(max pool 2x2 )、上卷积(up - conv 2x2 )操作,将输入图像转换为分割图输出。简单实用,应用广泛,起初用于医学领域,现在仍在该领域有大量应用。

主要网络结构:引入特征拼接操作,不同于以往单纯的加法操作,利用这种结构就能较好地完成分割任务。通过下采样(Down - sampling)和上采样(Up - sampling)以及跳跃连接(Skip connection)实现特征提取与融合 。

U - net++

整体网络结构:强调特征融合,拼接更全面,思路和densenet一致,尽可能利用所有能拼接的特征,是U - net的升级版。

Deep Supervision:通过在网络不同阶段添加监督信号(如图中的Gate 1x1 ),有助于训练和优化,提升模型性能。

U - net++ 的Deep Supervision(深度监督)

原理:采用多输出形式,在网络多个位置计算损失,然后更新网络参数 。这种方式在很多视觉任务中都适用,通过在中间层添加监督信号,帮助模型更好地训练,避免梯度消失等问题,提升模型性能。

U - net++ 的剪枝优势

- 原因:由于前面有单独的监督训练,使得U - net++ 更容易进行剪枝操作。

操作与效果:可以依据速度要求快速完成剪枝,在训练时也会用到相关策略(提到L4 ),实践证明效果不错 。通过剪枝可以去除模型中不重要的连接或参数,减小模型规模,提升推理速度,同时尽量不影响模型精度。

U - net+++

特征整合方式:利用不同尺度的最大池化(max pool)整合低阶特征(如X1和X2 ,可包含轮廓等信息 ),上采样操作整合高阶特征(具有大感受野,全局信息 )。

特征图生成:各层通过卷积统一得到64个特征图 ,最后将这些特征组合(5组64个特征图,共320个 )得到全部特征,用于后续的语义分割任务 。这是对U - net++ 的进一步改进探索,旨在更高效地提取和融合特征 。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值