空洞卷积
空洞卷积(dilated convolution)是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出的一种卷积思路。利用添加空洞扩大感受野,让原本 3×33\times 33×3的卷积核,在相同参数量的情况下,用于5×5(dilatedrate=2)5 \times 5(dilated rate=2)5×5(dilatedrate=2)或者更大的感受野,无须下采样。
扩张卷积(Dilated Convolution)又称空洞卷积(Atrous Convolution),向卷积层引入了一个称为 “扩张率(dilation rate)”的新参数,该参数定义了卷积核处理数据时各值的间距。换句话说,相比原来的标准卷积,扩张卷积多了一个超参数称之为dilation rate(扩张率),指的是kernel各点之间的间隔数量,正常的卷积核的扩张率为1。


上图是一个扩张率为2,尺寸为 3×33×33×3 的空洞卷积,感受野与5×55×55×5的卷积核相同,而且仅需要9个参数。你可以把它想象成一个5×5的卷积核,每隔一行或一列删除一行或一列。在相同的计算条件下,空洞卷积提供了更大的感受野。空洞卷积经常用在实时图像分割中。当网络层需要较大的感受野,但计算资源有限而无法提高卷积核数量或大小时,可以考虑空洞卷积。
我们来探究一下感受野

第一层的一个5×55×55×5大小的区域经过2次3×3的标准卷积之后,变成了一个点。也就是说从size上来讲,2层3∗33*33∗3卷积转换相当于1层5∗55*55∗5卷积。从以上图的演化也可以看出,一个5×5的卷积核是可以由2次连续的3×3的卷积代替。

但对于dilated=2dilated=2dilated=
空洞卷积:解析与应用

空洞卷积是一种解决图像语义分割中分辨率下降的技术,通过添加空洞增大感受野,避免信息丢失。它引入扩张率参数,允许在不增加计算负担的情况下获取更大范围的信息。然而,空洞卷积可能导致局部信息丢失和格网效应。图森组提出的HDC方案通过特定的空洞率组合解决了这些问题,确保连续性和适用于不同尺度的物体分割。良好的dilated convolution设计能有效避免格网效应并优化小物体分割效果。
最低0.47元/天 解锁文章
3196

被折叠的 条评论
为什么被折叠?



