batch_normalization和layer normalization的区别

直观的理解,batch vs layer normalization。
batch是“竖”着来的,各个维度做归一化,所以与batch size有关系。
layer是“横”着来的,对一个样本,不同的神经元neuron间做归一化。

 

给一个批次的数据[b,n,w,h]   

b是batch_size,n是特征图数目,w、h是宽和高。

batch_normalization是针对所有的样本,对某一个特征图计算均值和方差,然后然后对这个特征图神经元做归一化。

layer_normalization是对某一个样本,计算该样本所有特征图的均值和方差,然后对这个样本做归一化。

 

BN适用于不同mini batch数据分布差异不大的情况,而且BN需要开辟变量存每个节点的均值和方差,空间消耗略大;而且 BN适用于有mini_batch的场景。

LN只需要一个样本就可以做normalization,可以避免 BN 中受 mini-batch 数据分布影响的问题,也不需要开辟空间存每个节点的均值和方差。

### 使用或替代 `tf.layers.batch_normalization` 进行批归一化 在 TensorFlow 中,`tf.layers.batch_normalization` 是用于执行批量标准化的操作。然而,在较新的版本中推荐使用更灵活功能更强的层实现方式。 对于批归一化的应用,可以采用如下方法: #### 方法一:使用 Keras 层 API 实现批归一化 Keras 提供了一个更高层次的接口来构建神经网络模型,其中包含了 BatchNormalization 层可以直接调用[^1]。 ```python import tensorflow as tf from tensorflow.keras.layers import Input, Dense, BatchNormalization input_layer = Input(shape=(784,)) dense_layer = Dense(256)(input_layer) bn_layer = BatchNormalization()(dense_layer) model = tf.keras.Model(inputs=input_layer, outputs=bn_layer) ``` 这种方法不仅简化了代码编写过程,还提供了更好的兼容性扩展性。 #### 方法二:自定义批归一化函数 如果希望更加深入理解或者有特殊需求,则可以选择自己动手创建一个类似的批处理规范化函数[^2]。 ```python def batch_norm(x, is_training=True): beta = tf.Variable(tf.constant(0.0, shape=[x.shape[-1]]), name='beta', trainable=True) gamma = tf.Variable(tf.constant(1.0, shape=[x.shape[-1]]), name='gamma', trainable=True) axises = list(range(len(x.get_shape()) - 1)) batch_mean, batch_var = tf.nn.moments(x, axes=axises) ema = tf.train.ExponentialMovingAverage(decay=0.99) def mean_var_with_update(): ema_apply_op = ema.apply([batch_mean, batch_var]) with tf.control_dependencies([ema_apply_op]): return tf.identity(batch_mean), tf.identity(batch_var) mean, var = tf.cond(is_training, true_fn=mean_var_with_update, false_fn=lambda: (ema.average(batch_mean), ema.average(batch_var))) normed = tf.nn.batch_normalization(x, mean, var, beta, gamma, 1e-3) return normed ``` 此段代码实现了基本的批归一化逻辑,并通过指数移动平均保存训练期间计算得到的均值与方差以便于推理阶段使用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值