Octave Convolution学习笔记（附代码）

原创

于 2023-10-30 17:12:56 发布 · 855 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#学习 #笔记 #深度学习 #目标跟踪 #神经网络 #目标检测

本文介绍了OctaveNet网络及Octave Convolution。Octave Convolution是用于卷积神经网络的新型卷积操作，可减少空间冗余、计算量和内存占用。从频域角度理解图像和特征图，阐述其高低频表示。还给出网络结构图，将卷积操作拆成4部分以降低计算量，并提及代码实现参考。

论文地址：https://export.arxiv.org/pdf/1904.05049

代码地址：https://gitcode.com/mirrors/lxtgh/octaveconv_pytorch/overview?utm_source=csdn_github_accelerator

1.是什么？

OctaveNet网络属于paper《Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks with Octave Convolution》，是CVPR2019中的一篇论文。

Octave Convolution是一种用于卷积神经网络的新型卷积操作，旨在减少卷积神经网络中的空间冗余。它通过将输入特征图分成高频和低频两个部分，然后在这两个部分上执行不同的卷积操作，从而实现减少计算量和内存占用的目的。Octave Convolution的主要思想是将高频和低频特征图分开处理，以便更好地利用它们的特性。这种方法可以在不损失精度的情况下减少计算量和内存占用，从而提高卷积神经网络的效率。

2.为什么

从频域的角度理解图像
我们都知道，一副图像从空间域的角度看，它一般情况下是一个3 × W × H 3 \times W \times H3×W×H的矩阵，矩阵中每一个位置都有一个[0,255]的值，而从频域的角度出发的话，一副图像都可以被分解为描述平稳变化结构的低空间频率分量（低频域、low-frequency）和描述快速变化的精细细节的高空间频率分量（高频域、high-frequency），就像下面这幅图：