深入浅出pytorch -批归一化？如何卷积？如何转置卷积？

最新推荐文章于 2025-05-11 09:48:38 发布

原创

最新推荐文章于 2025-05-11 09:48:38 发布 · 1k 阅读

CC 4.0 BY-SA版权

文章标签：

本文深入探讨了卷积神经网络中的关键概念，包括卷积、转置卷积和各种归一化技术，如批次归一化、组归一化、实例归一化、层归一化和局部响应归一化。详细解析了每种技术的工作原理及在不同场景下的应用。

基础图像变换操作

1 空间域

Gamma Correction 伽马校正
$\alpha v^{\gamma}$ 第一：图像像素值（v）代表着亮度（Brightness）
第二： $\gamma>1$ 的时候，高亮度区域的变化大即细节增加，低亮度细节减少。
sober算子
边缘检测
具体可以搜索百度百科

2 频域
傅里叶变化
高频为细节，为轮廓。
低通滤波可以过滤细节。

SIFT:scale-invariant feature Transform
1. 首先计算金字塔表示（Pyramid Representation）
  高斯滤波 + 下采样
2. 找到图像金字塔中的特征点：
  拉普拉斯滤波器
  通过之前的高斯滤波和拉普拉斯整合可以成为， LoG高斯拉普拉斯滤波器。
  LoG 计算代价高，用DoG近似。

在这里插入图片描述

在这里插入图片描述
二维卷积下，默认的pytorch输入张量为 N,C,H,W

dilation 扩张卷积，增加感受野
transposed 控制是否进行转置卷积，也就是反卷积
摘自：https://www.zhihu.com/question/54149221

归一化都采取以下公式：
$\bold y = \gamma \frac{\bold x - E(\bold x)}{\sqrt{\bold{Var(x)+\epsilon}}} + \beta$

对于全连接层:
进入神经元前的输入，进行批归一化。
因此你针对的是每个神经元！，每个神经元的输入进行多数据平均。
图中 $Z$ 表示的就是输入到第一个神经元的输出， $x^1$ 就是批次里第一个数据。
在这里插入图片描述

$\times 1$
在这里插入图片描述

class troch.nn.BactchNorm2d(num_features, eps=1e-5, momentum=0.1, affine =True, track_running_states = True)

nums_features：输入通道数目C
eps: 防止分母为0
momentum 控制指数移动平均计算 $E(\bold x) 和 Var(\bold x)$ , 如果不用，则track_running_stats=False，就用如下更新：
$\hat x_{new} = (1-\alpha)x_{t-1} + \alpha \hat{x_t}$