Dilated conv在ICLR 2016上提出。其主要作用是在不增加参数和模型复杂度的条件下,可以指数倍的扩大视觉野(每一个输出是由视觉野大小的输入所决定的)的大小。 其中参数dilated 指的是kernel与kernel、kernel和空白的间隔数量(从下图中可以看出这一效果。蓝色的矩形表示视觉野。红色的小点表示kernel。在图a中,kernel是33,视觉野是33,dilated=1;在图b中,kernel是33,但是视觉野是77,dilated=2;在图c中,kernel是33,但是视觉野是1515,dilated=4. 可以看出在dilated(扩展系数)扩大时,视觉野同样扩大。
下面,我们使用1D的数据来详细看一下dilated。从下图可以看出,当dilated=2时,每一个输出,“看到了”3个输入(虽然其中2-1=1被忽略了)。当dilated=4时,“看到了”5个输入(4-1=3个被忽略了)

DilatedConv,即扩张卷积,于ICLR2016年提出,能在不增加参数的情况下显著扩大视觉野,提升模型感受野。本文通过实例解释了扩张系数如何影响视觉野的大小,展示了当扩张系数增大时,模型能够‘看到’更多的输入信息。
4460

被折叠的 条评论
为什么被折叠?



