Group Convolution 分组卷积

最新推荐文章于 2025-04-07 16:13:42 发布

木禾DING

最新推荐文章于 2025-04-07 16:13:42 发布

阅读量1.7k

点赞数 7

CC 4.0 BY-SA版权

分类专栏： Deep Learning 文章标签：计算机视觉深度学习卷积

本文链接：https://blog.youkuaiyun.com/ding_programmer/article/details/104469348

Deep Learning 专栏收录该内容

15 篇文章

订阅专栏

本文详细介绍了GroupConvolution（分组卷积），一种用于减少神经网络参数量的技术，最早出现在2012年的AlexNet中。分组卷积通过将输入特征图分组，并在各组内独立进行卷积操作，有效减少了计算资源的需求，同时在某些情况下还能提高模型的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Group Convolution分组卷积
最早见于AlexNet——2012年Imagenet的冠军方法，Group Convolution被用来切分网络，使其在2个GPU上并行运行，AlexNet网络结构如下：
在这里插入图片描述

Group Convolution 原理

如果输入feature map尺寸为 $C * H * W$ ，卷积核有N个，输出feature map与卷积核的数量相同也是N，每个卷积核的尺寸为 $C * K * K$ ，N个卷积核的总参数量为 $N * C * K * K$ 。如下图所示，传统卷积方法和分组卷积方法。
在这里插入图片描述
Group Convolution，则是对输入feature map进行分组，然后每组分别卷积。其实也就是，原本应该是 $C * H * W$ 的图片，用N个传统的卷积核 $C * K * K$ ，就可以生成 $N * H * W$ （假设经过池化，图片尺寸不变）这样其实，是一个通道为C来进行整体卷积生成一个图片。而分组卷积，是一个通道为 $CG\frac{C}{G}$ 来进行整体卷积生成一个图片。
具体来说就是，假设输入feature map的尺寸仍为 $C * H * W$ ，输出feature map的数量为N个，如果设定要分成G个groups，则每组的输入feature map数量为 $CG\frac{C}{G}$ ，每组的输出feature map数量为 $NG\frac{N}{G}$ ，每个卷积核的尺寸为 $CG∗K∗K\frac{C}{G}*K*K$ ，卷积核的总数仍为N个，每组的卷积核数量为 $NG\frac{N}{G}$ ，卷积核只与其同组的输入map进行卷积，卷积核的总参数量为 $N∗CG∗K∗KN∗\frac{C}{G}*K*K$ ，可见，总参数量减少为原来的 $1G\frac{1}{G}$ 。

Group Convolution的用途

减少参数量，分成G组，则该层的参数量减少为原来的 $1G\frac{1}{G}$
Group Convolution可以看成是structured sparse，每个卷积核的尺寸由 $C * K * K$ 变为 $CG∗K∗K\frac{C}{G}*K*K$ ，可以将其余 $(C−CG)∗K∗K(C−\frac{C}{G})*K*K$ 的参数视为0，有时甚至可以在减少参数量的同时获得更好的效果（相当于正则）。