文章作者:Tyan
博客:noahsnail.com | 优快云 | 简书、
1. 扩张卷积
Dilated Convolutions,翻译为扩张卷积或空洞卷积。扩张卷积与普通的卷积相比,除了卷积核的大小以外,还有一个扩张率(dilation rate)参数,主要用来表示扩张的大小。扩张卷积与普通卷积的相同点在于,卷积核的大小是一样的,在神经网络中即参数数量不变,区别在于扩张卷积具有更大的感受野。感受野是卷积核在图像上看到的大小,例如 3 × 3 3 \times 3 3×3卷积核的感受野大小为9。
2. 示意图
下图是扩张卷积的示意图。

(a) 普通卷积,1-dilated convolution,卷积核的感受野为
3
×
3
=
9
3 \times 3 = 9
3×3=9。
(b) 扩张卷积,2-dilated convolution,卷积核的感受野为
7
×
7
=
49
7 \times 7 = 49
7×7=49。
© 扩张卷积,4-dilated convolution,卷积核的感受野为
15
×
15
=
225
15 \times 15 = 225
15×15=225。
从上图中可以看出,卷积核的参数个数保持不变,感受野的大小随着“dilation rate”参数的增加呈指数增长。
3. 优点
扩展卷积在保持参数个数不变的情况下增大了卷积核的感受野,同时它可以保证输出的特征映射(feature map)的大小保持不变。一个扩张率为2的3×3卷积核,感受野与5×5的卷积核相同,但参数数量仅为9个,是5×5卷积参数数量的 36 % 36\% 36%。
4. 应用
扩张卷积在图像分割、语音合成、机器翻译、目标检测中都有应用。

本文介绍了扩张卷积(也称为空洞卷积),一种用于扩大卷积核感受野的技术,可在不增加参数数量的情况下提高网络性能。文章通过示例说明了不同扩张率下卷积核感受野的变化,并探讨了其在图像分割、语音合成等领域的应用。
4476

被折叠的 条评论
为什么被折叠?



