pytorch学习笔记系列（5）：卷积神经网络Conv2d&&Conv1d

最新推荐文章于 2025-06-20 15:42:20 发布

BruceWu1234

最新推荐文章于 2025-06-20 15:42:20 发布

阅读量2.8k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： pytorch

本文链接：https://blog.youkuaiyun.com/u014514939/article/details/88784945

本文介绍了卷积层的基本原理，包括卷积核如何提取原始数据特征，以及PyTorch中卷积层函数的具体参数和使用方法。并通过一个Mnist数据集上的CNN实现案例，展示了如何搭建并训练一个简单的卷积神经网络。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

卷积层原理

卷积层是用一个固定大小的矩形区去席卷原始数据，将原始数据分成一个个和卷积核大小相同的小块，然后将这些小块和卷积核相乘输出一个卷积值（注意这里是一个单独的值，不再是矩阵了）.
卷积的本质就是用卷积核的参数来提取原始数据的特征，通过矩阵点乘的运算，提取出和卷积核特征一致的值，如果卷积层有多个卷积核，则神经网络会自动学习卷积核的参数值，使得每个卷积核代表一个特征.

关于 nn.torch.Conv2d 函数

CLASS torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, 
padding=0, dilation=1, groups=1, bias=True)

假设 Conv2d 的输入 input 尺寸为 $N,C_{in},H_{in},W_{in})$ ，输出 output 尺寸为 $N,C_{out},H_{out},W_{out})$ ，有：
$out(N_i,C_{out_j})=bias(C_{out_j})+\sum_{k=0}^{C_{in}-1}weight(C_{out},k)*input(N_i,k)$