深度学习——池化层理论学习(Pooling Layer)

本文详细介绍了池化层的概念及其在深度学习中的应用。包括池化层的类型如最大池化、平均池化及重叠池化等,以及池化层在特征不变性、特征降维等方面的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 什么是池化层

  1. 池化是缩小高、长方向上的空间的运算。池化层是具有这种功能的一个深度学习的层。
  2. 对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度;一方面进行特征压缩,提取主要特征
    在这里插入图片描述
  3. 下图是Max池化的一个例子,将2* 2的区域集约成一个元素:
    在这里插入图片描述
    上述池化过程:按照步幅为2的间隔,依次对每一个2*2的区域取最大值,并将结果存到对应位置。一般来说,池化窗口的大小会和步幅设为相同的值。

2. 池化层作用

  1. 特征不变性:池化操作是模型更加关注是否存在某些特征而不是特征具体的位置。其中不变形性包括,平移不变性、旋转不变性和尺度不变性;
  2. 特征降维(下采样):池化相当于在空间范围内做了维度约减,从而使模型可以抽取更加广范围的特征。同时减小了下一层的输入大小,进而减少计算量和参数个数;
  3. 一定程度上防止过拟合,更方便优化;
  4. 实现非线性(类似relu);
  5. 扩大感受野。

3. 常见的池化层

3.1 最大池化层(max pooling layer)

选图像区域的最大值作为该区域池化后的值。
在这里插入图片描述

3.2 平均池化层(average pooling layer)

计算图像区域的平均值作为该区域池化后的值。
在这里插入图片描述

3.3 重叠池化层(Overlapping Pooling layer):

重叠池化,即相邻池化窗口之间会有重叠区域。如果定义池化窗口的大小为sizeX,定义两个相邻池化窗口的水平位移或竖直位移为stride,此时sizeX>stride。
在这里插入图片描述

3.4 其它池化层

https://zhuanlan.zhihu.com/p/77040467

4. 参考资料

https://blog.youkuaiyun.com/yjl9122/article/details/70198357
https://blog.youkuaiyun.com/Chen_Swan/article/details/105486854

### 平均池化层工作原理 在卷积神经网络中,平均池化层通过计算输入特征图上每个窗口内元素的平均值来减少数据维度并提取重要特征[^1]。具体来说,在给定大小的滑动窗口下,该操作会遍历整个输入矩阵,并针对每一个位置上的子区域求取其内部所有数值的算术平均作为输出的一部分。 对于二维图像处理而言,假设有一个 \( n \times n \) 的滤波器应用于尺寸为 \( h \times w \) 的激活映射,则经过一次步幅为 s 的平均池化之后得到的新激活映射的高度 H 和宽度 W 可以表示如下: \[H = \left\lfloor{\frac{h - n}{s} + 1}\right\rfloor,\quad W=\left\lfloor {\frac {w-n}{s}+1}\right\rfloor\] 其中 \(\left\lfloor x \right\rfloor\) 表示向下取整函数。此过程不仅有助于降低模型复杂度,还能增强对平移变换不变性的鲁棒性[^2]。 ```python import torch.nn.functional as F output = F.avg_pool2d(input_tensor, kernel_size=2, stride=2) ``` 上述代码展示了如何利用 PyTorch 库实现简单的二维平均池化功能。这里 `input_tensor` 是待处理的数据张量;参数 `kernel_size` 定义了用于采样的矩形框大小而 `stride` 则指定了每次移动的距离。 #### 图解说明 虽然无法直接提供具体的结构图表,但可以描述这样一个典型的场景:想象一张由像素组成的网格代表原始图片中的某个通道信息。当应用了一个 \(2\times2\) 大小且无重叠(即步长等于核宽高)的平均池化时,最终获得的结果将是原图缩小四分之一版本——每四个相邻单元格被替换成它们亮度水平的简单平均值得到的一个新点位。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值