直观理解Dilated Convolution

DilatedConvolution是一种特殊卷积方式,通过在kernel中增加间隔来扩大感受野,无需增加参数数量。它允许在保持kernel size不变的情况下,模拟更大尺寸的卷积效果,有效地捕捉更广阔的上下文信息。DilatedConv的kernel计算公式和输出特征图大小的计算方法也一并给出。这种技术常用于图像识别、语义分割等领域,以增强模型的远距离依赖学习能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Dilated Convolution是一种通过增加kernel元素间距(padding 0)使得感受野增加的一种卷积方式。所谓感受野就是特征图上每个点对应原图像的像素范围

Dilated_Conv

这样,在不改变kernel size(上图中的kernel size还是3x3)的情况下,增加了感受野。也可以理解为kernel size从3x3 变成了5x5(但是只有原来的3x3的位置有权值,其余位置均为0),Dilated Conv的kernel计算公式如下:
k′=k+(k−1)(d−1)=(k−1)d+1 k'=k+(k-1)(d-1) = (k - 1)d + 1 k=k+(k1)(d1)=(k1)d+1
即在原来的k-1个间隔中充填d-1行(列)0得到一个新的k’。从而Dilated Conv得到的特征图的计算公式为:
Hout=⌊Hin+2×padding−dilation×(kernel_size−1)−1stride+1⌋ H_{out} = \left\lfloor\frac{H_{in} + 2 \times \text{padding} - \text{dilation} \times (\text{kernel\_size} - 1) - 1}{\text{stride}} + 1\right\rfloor Hout=strideHin+2×paddingdilation×(kernel_size1)1+1
Dilated Conv 在已有像素点的基础上,有意skip掉一些像素点,或者输入不变,但是Conv的kernel中某些权值部分设置为0,达到增大感受野的目的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

daimashiren

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值