Tensoflow_Batch_Normalization

最新推荐文章于 2025-04-27 10:14:00 发布

原创最新推荐文章于 2025-04-27 10:14:00 发布 · 174 阅读

CC 4.0 BY-SA版权

21 篇文章

订阅专栏

本文深入解析BatchNormalization技术，包括其公式、工作原理及在深度学习中的应用。探讨了BN如何通过调整输入分布加速训练过程，避免梯度消失和爆炸，同时减少过拟合风险。介绍了TensorFlow中实现BN的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

BN公式

其中: $x_{i}$ 是输入， $μB\mu _{B}$ 是均值， $σB2\sigma _{B}^{2}$ 是方差， $γ$ 是缩放系数（scale）， $β$ 是偏移（offset）系数， $ε\varepsilon$ 是方差偏移系数， $BN(x_{i})$ 是输出。

批标准化（batch normalization，BN），一般用在激活函数之前，使结果 $y = w x + b$ ，各个维度参数均值为0，方差为1。通过规范化让激活函数的输入分布在线性区间，让每一层的输入有一个稳定的分布会有利于网络的训练。
优点：

mean, variance = tf.nn.moments(x, axes, name=None, keep_dims=False)

计算统计矩，mean 是一阶矩即均值，variance 则是二阶中心矩即方差，axes=[0]表示按列计算；

tf.nn.batch_normalization(x, mean, variance, offset, scale, variance_epsilon, name=None)

tf.nn.batch_norm_with_global_normalization(x, mean, variance, beta, gamma, variance_epsilon, scale_after_normalization, name=None)；

tf.nn.moments 计算返回的 mean 和 variance 作为 tf.nn.batch_normalization 参数调用；