归一化/标准化

最新推荐文章于 2025-03-13 07:13:30 发布

原创最新推荐文章于 2025-03-13 07:13:30 发布 · 1.9k 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #深度学习 #机器学习

深度学习同时被 2 个专栏收录

8 篇文章

订阅专栏

数学知识

3 篇文章

订阅专栏

本文详细介绍了数据预处理中的归一化和标准化技术，包括线性归一化、非线性归一化、Z-score标准化和去中心化等方法。归一化有助于消除量纲影响，增强特征间可比性，加速模型训练。标准化通过Z-score公式实现，常用于消除数据分布差异。此外，还探讨了PyTorch中的BN（Batch Normalization）层及其作用。BN层通过调整输入数据的均值和方差，稳定网络内部的梯度流动，提高训练效率。

一、前言

归一化和标准化都是一种数据变换的方式，将原始的一列数据变换到某个范围。

二、归一化

2.1 线性归一化

归一化(Normalization)，将数据固定到某个区间，通常为[0,1]。几种常见的归一化方式如下所示：
(1) Min-Max Normalization： $X_{i}^{'}=\frac{X_i-X_{min}}{X_{max}-X_{min}}$
(2) 平均归一化： $X_{i}^{'}=\frac{(X_{i}-\mu)}{X_{max}-X_{min}}$ ，其中 $\mu=mean(X)$
(3) 转化为比例的归一化： $X_{i}^{'}=\frac{X_i}{sum(X)}$
备注：当有新数据加入时，可能导致 $X_{max}$ 和 $X_{min}$ 会发生变化，需要重新定义。

2.2 非线性归一化

(1) 对数函数转换： $y = l o g 10 (x)$
(2) 反正切函数转换： $y=arctan(x)*(2/\pi)$
备注：非线性归一化经常用在数据分化比较大的场景，有些数值很大，有些数值较小。通过一些数学函数，将原始值进行映射。该方法包括log、指数，正切等。需要根据数据的分布情况，决定非线性函数的曲线，比如 $l o g 2 (x)$ 或 $l o g 10 (x)$ 。
备注：归一化不改变数据的原始分布
归一化的作用：将某个特征的值映射到[0,1]之间，消除量纲对最终结果的影响，使不同的特征具有可比性，使得原本可能分布相差较大的特征对模型有相同权重的影响，提升模型的收敛速度，深度学习中数据归一化可以防止模型梯度爆炸。

三、标准化

(1) Z-score标准化(标准差标准化)
$X_{i}^{'}=\frac{(X_{i}-\mu)}{\sigma}$ 其中， $\mu$ 为数据 $X$ 的均值， $\sigma$ 为数据X的标准差。
(2) 去中心化
$X_{i}^{'}=(X_{i}-\mu)$

四、pytorch的BN层

BN层计算公式，如下图所示。
其中， $\gamma$ 和 $\beta$ 为可学习的参数。
BN层的输出Y与输入X之间的关系是：Y = (X - running_mean) / sqrt(running_var + eps) * gamma + beta，此不赘言。其中gamma、beta为可学习参数（在pytorch中分别改叫weight和bias），训练时通过反向传播更新；而running_mean、running_var则是在前向时先由X计算出mean和var，再由mean和var以动量momentum来更新running_mean和running_var。所以在训练阶段，running_mean和running_var在每次前向时更新一次；在测试阶段，则通过net.eval()固定该BN层的running_mean和running_var，此时这两个值即为训练阶段最后一次前向时确定的值，并在整个测试阶段保持不变。