pytorch的conv2d函数groups分组卷积使用及理解

最新推荐文章于 2025-10-21 15:03:50 发布

原创最新推荐文章于 2025-10-21 15:03:50 发布 · 1.6w 阅读

·

30

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#卷积 #python

机器学习专栏收录该内容

34 篇文章

订阅专栏

本文主要探讨PyTorch中conv2d函数的groups参数，解释了当group分别为1和3时卷积计算的区别。分组卷积在减少参数数量的同时，能够提升网络性能。通过对比标准卷积与分组卷积的计算过程，强调了分组卷积在GPU并行计算上的优势。

部署运行你感兴趣的模型镜像

重点在于groups参数的理解

1、groups参数是如何影响卷积计算的

conv = nn.Conv2d(in_channels=6, out_channels=6, kernel_size=1, groups=3)
conv.weight.data.size()

输出：

torch.Size([6, 2, 1, 1])

（此时转置参数Transposed默认为False，源码如下)

当group=1时，该卷积层需要6*6*1*1=36个参数，即需要6个6*1*1的卷积核

计算时就是6*H_in*W_in的输入整个乘以一个6*1*1的卷积核，得到输出的一个channel的值,即1*H_out*W_out。这样经过6次与6个卷积核计算就能够得到6*H_out*W_out的结果了

如果将group=3时，卷积核大小为torch.Size([6, 2, 1, 1])，即6个2*1*1的卷积核，只需要需要6*2*1*1=12个参数

那么每组计算就只被in_channels/groups=2个channels的卷积核计算，当然这也会将输入分为三份大小为2*H_in*W_in的小输入，分别与2*1*1大小的卷积核进行三次运算，然后将得到的3个2*H_out*W_out的小输出concat起来得到最后的6*H_out*W_out输出

在实际实验中，同样的网络结构下，这种分组的卷积效果是好于未分组的卷积的效果的。

2、为什么要设置groups参数，有什么优点？

为了在GPU上并行计算：

标准卷积的计算如下图：

举个例子，假设有一个3×3大小的卷积层，其输入通道为16、输出通道为32。
那么一般的操作就是用32个3×3的卷积核来分别同输入数据卷积，这样每个卷积核需要3×3×16个参数，得到的输出是只有一个通道的数据。之所以会得到一通道的数据，是因为刚开始3×3×16的卷积核的每个通道会在输入数据的每个对应通道上做卷积，然后叠加每一个通道对应位置的值，使之变成了单通道，那么32个卷积核一共需要(3×3×16)×32 =4068个参数。

分组卷积的计算：

卷积的几种常见操作可以参见：

https://blog.youkuaiyun.com/chenyuping333/article/details/82531047?utm_source=blogxgwz6

另外标准卷积的详细计算图可表示为：

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

评论 2

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。