Batch Normolization(批归一化）

最新推荐文章于 2023-03-20 16:24:20 发布

Roger-Liu

最新推荐文章于 2023-03-20 16:24:20 发布

阅读量1.2k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Machine Learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_43243022/article/details/85683288

批归一化（Batch Normalization）用于解决内部协变量偏移问题，通过计算迷你批次的均值和方差对网络层输入进行归一化，加速模型训练的收敛速度，并具有一定的正则化效果。它在神经网络中调整输入分布，使模型参数学习更加稳定高效。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Why:

Internal Covariate Shift:网络中间层在训练过程中，输入数据分布的改变。训练过程中参数会不断的更新，前面层训练参数的更新将导致后面层输入数据分布的变化。

因此，模型参数要不断去适应这种随迭代变化的输入分布，这回导致模型参数学习很慢。如果能使每层的输入分布固定（如均值为0，方差为1的高斯分布），那么模型参数的学习将会更加容易。

What:

将每层输入的分布做归一化的操作，叫做Batch Normolization(批归一化）。

输入——>计算mini-batch的均值和方差——>归一化——>线性变换——>输出

Results:

输入数据样本空间中的分布将更加均匀和固定，模型参数的学习也会变得更加容易，显著加速模型训练的收敛速度。
限制了在前层的参数的更新，减少了输入值改变的问题，使输出值更加稳定，因此有轻微的正则化的效果。
给隐藏层增加了噪音，有一定的正则化效果。

How:

卷积神经网络经过卷积后得到的是一系列的特征图，如果min-batch sizes为m，那么网络某一层输入数据可以表示为四维矩阵(m,f,p,q)，m为min-batch sizes，f为特征图个数，p、q分别为特征图的宽高。在cnn中我们可以把每个特征图看成是一个特征处理（一个神经元），因此在使用Batch Normalization，mini-batch&nb

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。