空洞卷积与RFBNet--------网格问题

本文探讨了空洞卷积(dalited conv)的gridding effect问题和在捕捉小目标时的局限性。RFBNet通过在dilated卷积前使用对应尺寸的传统卷积,有效地缓解了这一问题,同时借鉴了人眼视觉皮层的特性,增强了中心点的权重。RFBNet与ASPP结构的主要区别在于处理gridding效应的方式,提供了更优的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前言: 最近在看RFBNet,其中提到ASPP结构的缺陷,当时不太理解,回去重新看了一下dalited conv


一、dalited conv的缺陷

    问题1:gridding effect

     众所周知,空洞卷积在不增加参数的情况下扩大了卷积的感受野,但是与此同时带来了一个比较严峻的问题。由于空洞卷积在特征图上是离散的采样,缺乏相关性(个人认为这种操作在单独使用dalited conv时是一种优点),但是在dalited conv连续堆叠的情况(如下图)下, kernel 并不连续,也就是并不是所有的 pixel 都用来计算了,因此这里将信息看做 checker-board 的方式会损失信息的连续性,这就是所谓的gridding问题。

 

问题2:远距离获取的信息没有相关性

     从dalited conv的机理上我们也可以看出,它稀疏的采样输入信息,对于大目标的语义信息获取会取得比较好的结果,但是会丢失局部信息,对于小目标来说,由于间隔过大,单独的使用dilated conv可能会丢失小目标。

二、感言

    RFBNet本身并非针对Gridding问题而设计,但笔者感觉其无心插柳解决了这个问题。下面放一张RFBNet的结构图,其精妙之处在于dilated卷积前一层的设计,核心在于dilated的采样点处,使用对应尺寸的传统卷

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值