文章阅读:deeplab v3++

DeepLabv3+是语义分割领域的模型,结合了空间金字塔池模块和编码器解码器结构。该模型利用Xception作为基础,并在ASPP模块和解码器中应用深度可分离卷积,提高速度和性能。通过空洞卷积,它能在不损失信息的情况下扩大感受野,增强特征提取。模型的解码器模块有助于精确地恢复对象边界。

原文地址deeplab v3++

概述

  1. 在本文中,我们考虑了空间金字塔池模块或编码器解码器结构进行语义分割的神经网络,前者通过不同分辨率的池化特征获取丰富的上下文信息,后者能够获得清晰的对象边界。
  2. 所提出的模型DeepLabv3 +包含来自编码器模块的丰富语义信息,而详细的对象边界由简单而有效的解码器模块恢复。编码器模块允许我们通过应用atrous卷积以任意分辨率提取特征。
  3. DeepLabv3+主要在模型的架构上作文章,为了融合多尺度信息,其引入了语义分割常用的encoder-decoder形式。在 encoder-decoder 架构中,引入可任意控制编码器提取特征的分辨率,通过空洞卷积平衡精度和耗时。
  4. 我们将Xception模型用于分段任务,并将深度可分离卷积应用于ASPP模块和解码器模块,从而产生更快更强的编码器 - 解码器网络。

model

deeplab v3+的结构图如图所示:
对建议的MultiRes块进行分拆,通过并行使用3×3、5×5和7×7卷积滤波器并连接所生成的特征图来开始一个简单的Inception like块(图3a)。这能够根据不同的上下文大小来协调空间特征。与其并行使用3×3、5×5和7×7过滤器,将更大,更昂贵的5×5和7×7过滤器分解为一系列3×3过滤器(图3b)。图3c展示了MultiRes块,其中逐渐增加了连续三层中的过滤器数量,并添加了剩余连接(以及1×1过滤器以节省尺寸)
我们提出的DeepLabv3 +通过采用编码器解码器结构扩展了DeepLabv3。编码器模块通过在多个尺度上应用迂回卷积来编码多尺度上下文信息,而简单但有

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值