算法面试BatchNormalization批标准化(2) BN的具体操作与计算

上一篇讲了BN是怎么缓解梯度消失与梯度爆炸的,这次详细看一下BN的实际操作,能够帮助我们更好的理解其作用。

BatchNormalize的具体操作

在训练和测试阶段,批量归一化的计算方式不同。

训练阶段

在每个隐藏层,Batch Normalization 将信号转换如下:
在这里插入图片描述

BN 层首先使用 (1) 和 (2) 确定整个批次的激活值的均值 𝜇 和方差 σ²。
然后它用 (3) 对***激活向量 Z^(i)*** 进行归一化。 这样,每个神经元的输出在批次中遵循标准正态分布。 (𝜀 是用于数值稳定性的常数)

批量标准化第一步。 一个 3 神经元隐藏层的示例,批次大小为 b。 每个神经元都遵循标准正态分布。 | 信用:作者 - 设计:Lou HD批量标准化第一步。 一个 3 神经元隐藏层的示例,批次大小为 b。 每个神经元都遵循标准正态分布。 | 信用:作者 - 设计:Lou HD
在这里插入图片描述

最后,它通过使用 𝛾 和 𝛽 这两个可训练参数 (4) 应用线性变换来计算层的输出 Ẑ(i)。 这样的步骤

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值