池化层的改进

最新推荐文章于 2025-03-20 22:10:45 发布

陈生~

最新推荐文章于 2025-03-20 22:10:45 发布

阅读量2.1k

点赞数

分类专栏：深度学习基础文章标签：深度学习卷积神经网络

本文链接：https://blog.youkuaiyun.com/qq_43257640/article/details/104748057

版权

深度学习基础专栏收录该内容

11 篇文章

订阅专栏

池化层的作用

降采样
减少参数量（进而降维、去除冗余、减少计算量等等）
扩大感受野
具有一定的尺度、旋转不变性

从新的角度看池化层

池化可以看成是对滑动窗口内的激活值（activation）线性加权。。具体的数学形式如下：
设F为池化函数，I为输入的特征图（FeatureMap）, O为池化后的输出,考虑单通道情况下， $I_{x,y},O_{x,y}$ 分别表示输入和输出在坐标(x,y)处的激活值， $\Omega$ 为池化窗口的索引集合，例如池化范围是 $2\times2$ ，则 $\Omega=\{0,1,2\}$ 。所有的池化方式可看作：
$O_{x',y'}=\frac{\sum_{\delta x,\delta y \in\Omega}F(I)_{x+\delta x,y+\delta y} I_{x+\delta x,y+\delta y}}{\sum_{\delta x,\delta y \in\Omega}F_{x+\delta x,y+\delta y} }$

常用的池化层及缺点

average pooling —— $F (I) = 1$ .表示窗口内的所有激活值权值相等。虽然综合考虑了所有值，但会模糊重要的特征。研究表明average pooling 效果通常不如 max pooling.

max pooling —— $F(I)=\lim_{\beta\rightarrow\inf}exp(\beta I)$ . maxpooling的前提假设是越重要的特征激活值越大。很多时候这种情况并不能被满足。

stride convolution —— 跨步卷积通常步长大于等于2，可以等效成两步：第一步使用步长为1的卷积，第二步采样，将坐标是步长整数倍的保留，非整数倍的抛弃，即可以写成这种形式: $F(I)_{x,y}=Indicator(x\;and\;y\;are\;both\;multiple\;of\;stride)$ 。显然，这种抛弃固定位置的方法可能会丢失重要的特征.