组卷积小结

本文介绍了分组卷积的概念,它通过将输入数据按深度分成多个组,每组使用独立的卷积核进行卷积运算,从而减少参数数量,降低了对存储器容量的需求。分组卷积保持了输出通道数,但每个卷积核的深度减小,实现了并行计算,提高了计算效率。

首先讲解卷积

从上图可以看出,一般的卷积会对输入数据的整体一起做卷积操作,即输入数据:H1xW1xC1,而卷积核大小h1xw1,通道为c1,一共有c2个,然后卷积得到的输出数据就是H2xW2xC2,这里我们假设输入和输出的分辨率是不变的,这对存储器的容量提出了明显的要求。但是分组卷积就没有那么多的参数 。对于上面所说的同一个参数,分组卷积如下图所示,

可以看出,图中将输入数据分成了2组(组数为g),需要注意的是这种分组只是在深度上进行划分,即某几个通道编为一组,这个具体的数量由C1/g决定,因为输出数据的改变,卷积核的数量也要跟着改变。即每组卷积核的深度变为C1/g,而每组卷积核的大小是不需要跟着改变的,此时每组卷积核的个数变成C2/g,而不是原来的C2了。然后用每组的卷积核同他们对应组内的输入数据卷积,得到了输出数据后,再用concatenate的方式组合起来,最终的输出数据的通道还是C2。也就是说分组数g确定后,我们将并行的运算g个相同的卷积过程,每个过程里,输入数据为H1xW1xC1/g,卷积核大小h1xw1xC1/g,一共有C2/g个,输出数据H2xW2xC2/g。

参考:https://blog.youkuaiyun.com/shentu7/article/details/105574369 

### 卷积神经网络结构 卷积神经网络(CNN)是一种专门设计用于处理具有网格状拓扑的数据架构,如时间序列数据或图像数据。典型的 CNN 主要由以下几个部分组成: #### 输入层 输入层接收原始像素值作为输入,对于彩色图片通常是三维张量形式,维度分别是高度、宽度和颜色通道数。 #### 卷积层 卷积层通过应用一系列滤波器来提取局部特征[^2]。这些滤波器在输入矩阵上滑动并执行逐元素乘法再求和的操作,生成新的特征图谱。每一层可能有多个这样的过滤器,因此会产生多张不同类型的特征映射。 #### 激活函数层 为了引入非线性因素,在每次卷积之后通常会加入激活函数,最常用的是 ReLU 函数 `f(x)=max(0,x)` ,它能够有效地防止梯度消失问题并且加速训练过程。 #### 池化层 池化操作用来降低特征的空间尺寸,减少计算复杂度的同时保留重要信息。常见的做法是对每个小区域取最大值(Max Pooling) 或者平均值(Average Pooling)。 #### 全连接层 在网络末端,全连接层负责将之前各层所学习到的高度抽象化的特征组合起来形成最终决策边界,完成分类任务。值得注意的是,现代实践中有时也会采用全局平均池化代替传统意义上的全连接层以简化模型结构并减轻过拟合风险。 ```python import torch.nn as nn class SimpleCNN(nn.Module): def __init__(self, num_classes=10): super(SimpleCNN, self).__init__() # 定义卷积层 self.conv_layer = nn.Sequential( nn.Conv2d(in_channels=3, out_channels=64, kernel_size=3), nn.ReLU(), nn.MaxPool2d(kernel_size=2)) # 定义全连接层 self.fc_layer = nn.Linear(64 * ((input_height//2)-2), num_classes) def forward(self, x): x = self.conv_layer(x) x = x.view(x.size(0), -1) # 展平成一维向量 x = self.fc_layer(x) return x ``` ### 立体构图解释 立体视觉是指利用两幅或多幅来自不同视角的图像重建场景三维几何形状的过程。在这个过程中,3D-2D 匹配扮演着至关重要的角色。具体来说,就是将在已知环境中获取的 3D 数据点投影至当前摄像机拍摄的画面内,并尝试找到对应的 2D 特征点进行匹配[^1]。这种技术广泛应用于机器人导航、增强现实等领域当中。 当涉及到闭环检测时,系统不仅依赖于简单的 3D 到 2D 的转换,还会进一步实施更复杂的 3D 对象之间的对比分析。比如通过对齐两个时刻观测到的对象表面平面特性来进行精确定位调整,确保轨迹不会随着时间推移而累积误差。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值