关于设计解决空洞卷积中‘gridding effect‘问题的几个原则（简单易懂）

最新推荐文章于 2024-01-22 23:16:27 发布

小林学编程

最新推荐文章于 2024-01-22 23:16:27 发布

阅读量6.4k

点赞数 16

文章标签： cnn 深度学习计算机视觉神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_57643648/article/details/122790230

版权

一：什么是空洞卷积：

（因为该内容较长，作者会在文章底部提供本人学习空洞卷积的博客连接，供大家学习参考）

二：空洞卷积的优点：

（1）：增大感受野：

对于普通卷积来说，空洞卷积有效地扩大了每一次运算的视野（在下文有清晰的表示）。

（2）：保持原输入特征图W（宽），H（高）：

也就是说原输入的特征图和特征矩阵不会因为引入空洞卷积而导致输入发生改变。

三：什么是‘gridding effect’问题：

如图所示：

不难看出在此例子当中有四层卷积计算层，而每次的空洞卷积‘dialted rate’（膨胀率）设为2时，在layer4层中利用到layer1层的区域（就是图中不为0的区域，而数字的大小是利用的次数）中间会产生许多缝隙，这会导致利用到的原始数据不连续（中间有许多数字为0的区域），会导致有很多细节会缺失，这种问题就是‘gridding effect’问题。-

四：设计不会产生‘gridding effect’现象的‘dialted rate’选用原则

（1）： $M_2<=K$ 原则：

如下图公式：

图中:

$r_i$ ：第i层的膨胀系数

$M_i=r_i$

就举个例子来说r=[1,2,5] $M_2$ =max[5-2*2,5-2*(5-2),2]=2 （K是kernel size 卷积核的第一个维度数，这里设置的是3）

有K=3>= $M_2$ =2,所以成立，不会出现‘gridding effect’问题，如下图，全部区域都有用到：

（2）：将‘dialted rate’设计成锯齿结构：

简单来讲就是重复所给定的一组系数，如r=[1,2,3,1,2,3],r=[1,2,5,1,2,5]类似这种格式，也不会出现‘gridding effect’问题。

（3）：设置的‘dialted rate’公约数不能大于一：

如r=[2,4,6]这组公约数为2大于1所以会出现‘gridding effect’问题，如图：（很明显有很多区域没有被利用）

五：参考资料：

（1）空洞卷积介绍：）吃透空洞卷积(Dilated Convolutions)_程序客栈（@qq704783475）-优快云博客（https://blog.youkuaiyun.com/weixin_40519315/article/details/105115649（2）上述图的来源，和三个原则的提出：

膨胀卷积(Dilated convolution)详解_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1Bf4y1g7j8?spm_id_from=333.1007.top_right_bar_window_history.content.click

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小林学编程 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。