deeplabV3+

deeplabV3+采用Encoder-Decoder结构,包括backbone、ASPP和decoder。backbone使用resnet101,通过膨胀卷积增大感受野,防止信息丢失。ASPP利用不同膨胀率的3x3卷积捕获多尺度信息。decoder结合全局信息,最终输出语义分割结果。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

deeplabV3+

deeplabV3+主要运用了Encoder-Decoder结构
主要包括三个结构:
1.backbone
2.aspp
3.deconder
其中前两项称为Encoder

在这里插入图片描述
上图对于整个过程画的特别清楚,自我感觉很容易进行理解。

deeplabV3 运用了膨胀卷积,在保证图像大小不变的情况下,增大了图片的感受野。
在这里插入图片描述

Backbone 我采用的resnet101, 如上图所示,在图像缩小为16倍后,运用膨胀卷积在保证图片大小不变,感受野却继续增大。(注意:语义分割中,更深的层数决定图像的轮廓,浅层的深度显示的是物体的细节。)但是如果图像尺寸缩小的太小,在还原的过程中会导致信息缺失,因此膨胀卷积很好地解决了这一问题。
如最上方的一张图最后backbone一共有两个输出部分,一个是最后一层的输出,另一个是从中间层进行输出(中间层截取的是图像1/4处,进行计算可以得到)。为什么呢?
因为全局特征或上下文之间的互相作用有助于做语义分割

采用Aspp结构(带膨胀卷积的空间金字塔池化),作用:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值