空洞卷积学习

最新推荐文章于 2025-10-25 08:00:00 发布

原创

最新推荐文章于 2025-10-25 08:00:00 发布 · 2.8k 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#学习 #计算机视觉 #深度学习

空洞卷积是一种解决图像语义分割中分辨率下降的技术，通过添加空洞增大感受野，避免信息丢失。它引入扩张率参数，允许在不增加计算负担的情况下获取更大范围的信息。然而，空洞卷积可能导致局部信息丢失和格网效应。图森组提出的HDC方案通过特定的空洞率组合解决了这些问题，确保连续性和适用于不同尺度的物体分割。良好的dilated convolution设计能有效避免格网效应并优化小物体分割效果。

空洞卷积

空洞卷积（dilated convolution）是针对图像语义分割问题中下采样会降低图像分辨率、丢失信息而提出的一种卷积思路。利用添加空洞扩大感受野，让原本 $3×33\times 3$ 的卷积核，在相同参数量的情况下，用于 $\times 5(dilated rate=2)$ 或者更大的感受野，无须下采样。

扩张卷积（Dilated Convolution）又称空洞卷积（Atrous Convolution），向卷积层引入了一个称为 “扩张率(dilation rate)”的新参数，该参数定义了卷积核处理数据时各值的间距。换句话说，相比原来的标准卷积，扩张卷积多了一个超参数称之为dilation rate（扩张率），指的是kernel各点之间的间隔数量，正常的卷积核的扩张率为1。

空洞卷积

空洞卷积动态采样展示

上图是一个扩张率为2，尺寸为 $3 \times 3$ 的空洞卷积，感受野与 $5 \times 5$ 的卷积核相同，而且仅需要9个参数。你可以把它想象成一个5×5的卷积核，每隔一行或一列删除一行或一列。在相同的计算条件下，空洞卷积提供了更大的感受野。空洞卷积经常用在实时图像分割中。当网络层需要较大的感受野，但计算资源有限而无法提高卷积核数量或大小时，可以考虑空洞卷积。