直观理解Dilated Convolution

daimashiren

已于 2023-04-10 14:41:04 修改

阅读量1.8k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习学习笔记文章标签：深度学习机器学习计算机视觉

于 2022-02-20 20:57:29 首次发布

本文链接：https://blog.youkuaiyun.com/daimashiren/article/details/123035868

深度学习同时被 2 个专栏收录

14 篇文章

订阅专栏

学习笔记

10 篇文章

订阅专栏

DilatedConvolution是一种特殊卷积方式，通过在kernel中增加间隔来扩大感受野，无需增加参数数量。它允许在保持kernel size不变的情况下，模拟更大尺寸的卷积效果，有效地捕捉更广阔的上下文信息。DilatedConv的kernel计算公式和输出特征图大小的计算方法也一并给出。这种技术常用于图像识别、语义分割等领域，以增强模型的远距离依赖学习能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Dilated Convolution是一种通过增加kernel元素间距(padding 0)使得感受野增加的一种卷积方式。所谓感受野就是特征图上每个点对应原图像的像素范围。

Dilated_Conv

这样，在不改变kernel size(上图中的kernel size还是3x3)的情况下，增加了感受野。也可以理解为kernel size从3x3 变成了5x5(但是只有原来的3x3的位置有权值，其余位置均为0)，Dilated Conv的kernel计算公式如下:
$k^{'} = k + (k - 1) (d - 1) = (k - 1) d + 1$
即在原来的k-1个间隔中充填d-1行(列)0得到一个新的k’。从而Dilated Conv得到的特征图的计算公式为:
$Hout=⌊Hin+2×padding−dilation×(kernel_size−1)−1stride+1⌋ H_{out} = \left\lfloor\frac{H_{in} + 2 \times \text{padding} - \text{dilation} \times (\text{kernel\_size} - 1) - 1}{\text{stride}} + 1\right\rfloor$
Dilated Conv 在已有像素点的基础上，有意skip掉一些像素点，或者输入不变，但是Conv的kernel中某些权值部分设置为0，达到增大感受野的目的。