池化和空洞卷积_图像语义分割(5)-DeepLabV2: 使用深度卷积网络空洞卷积和全连接条件随机场进行图像语义分割...

最新推荐文章于 2025-01-26 11:51:41 发布

原创最新推荐文章于 2025-01-26 11:51:41 发布 · 646 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#池化和空洞卷积

DeepLabV2通过使用ResNet替代VGG-16，引入空洞卷积和ASPP模块解决下采样导致的分辨率降低和多尺度对象信息问题。空洞卷积增加感受野，ASPP并行不同采样率的空洞卷积进行多尺度信息融合，Dense CRF用于边界细化，提高分割精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文地址：DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs
论文代码：github链接

1. 简介

DeepLabV2是在V1基础上的优化，不同与V1，模型采用Resnet代替VGG-16，提出ASPP代替标准多尺度处理进行多尺度的特征的捕捉和融合，取得了更好的效果。

2. 主要问题

下采样导致特征分辨率的降低
多尺度对象信息
DCNN内在不变性导致定位精度低

3. 解决方案

空洞卷积解决感受野和分辨率的问题：最后及格最大池化层去掉下采样的层，以空洞卷积代替
空洞卷积空间池化金字塔解决多尺度对象的问题：在给定的出入上以不同采样率的空洞卷积进行采样
Dense CRF解决边界细化的问题：全连接条件随机场捕捉边界细节特征

4. 具体步骤

调整ImageNet pre-train的ResNet为全卷积结构，结合空洞卷积和ASPP得到粗略结果
双线性插值扩大特征图到原图大小
全连接条件随机场细化预测结果，输出最终结果

5.模型和方法

5.1 空洞卷积

进行空洞卷积的两个有效的方法：

通过插入空洞(零)来隐含地对滤波器进行上采样，或等效稀疏地对输入特征图进行采样。通过向im2col函数(从多通道特征图中提取矢量化块)添加稀疏采样底层特征图实现了这一点
用一个等于空洞卷积率 r 等效的因子对输入特征图下采样，对于每一个r×rr×r的移位，都对其进行去交织以产生r^2r2大小的的分辨率映射。然后将标准卷积应用于这些中间特征图，并隔行扫描生成原始图像分辨率。通过将多孔卷积变换为常规卷积，可以使用现成的高度优化的卷积方法。

5.2 ASPP

不同于标准的多尺度特征处理方法中，先对图像进行多个不同尺度的放缩然后采用相同参数进行特征提取之后再融合得到最终的结果，空洞卷积空间池化特征金字塔(Atrous Spatial Pyramid Pooling)对相同的输入进行并行的不同采样率的空洞卷积然后进行特征融合，如下图

5.3 Dense CRF

欢迎关注 深度学习与数学 [每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读，算法和其他互联网技能的学习，概率论、线性代数等高等数学知识的回顾]

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。