6.5 Batch Normalization

Shield-Z

已于 2024-03-27 09:04:43 修改

阅读量1k

点赞数 9

CC 4.0 BY-SA版权

文章标签： batch 开发语言笔记

于 2024-03-26 09:33:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Ting_28/article/details/137007056

在训练神经网络时，往往需要标准化（normalization）输入数据，使得网络的训练更加快速和有效。

然而SGD（随机梯度下降）等学习算法会在训练中不断改变网络的参数，隐藏层的激活值的分布会因此发生变化，而这一种变化就称为内协变量偏移（Internal Covariate Shift，ICS）。

为了解决ICS问题，批标准化（Batch Normalization）固定激活函数的输入变量的均值和方差，使得网络的训练更快。

除了加速训练这一优势，Batch Normalization还具备其他功能：

①应用了Batch Normalization的神经网络在反向传播中有着非常好的梯度流；

这样，神经网络对权重的初值和尺度依赖减少，能够使用更高的学习率，还降低了不收敛的风险。

②Batch Normalization还具有正则化的作用，Dropout也就不再需要了。

③Batch Normalization让深度神经网络使用饱和非线性函数成为可能。

一、Batch Normalization的实现方式

Batch Normalization在训练时，用当前训练批次的数据单独的估计每一激活值 x⁽ᴷ⁾ 的均值和方差。为了方便，我们接下来只关注某一个激活值 x⁽ᴷ⁾ ，并将 k 省略掉，现定义当前批次为具有 m 个激活值的 β：

β = Xi （i=1，...，m）

首先，计算当前批次激活值的均值和方差：

然后用计算好的均值 $\mu _{\beta }$ 和方差 δ_β ² 标准化这一批次的激活值 $x_{i}$ ，得到

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄2年

22
原创

365
点赞

272
收藏

350
粉丝

关注

私信

热门文章

上一篇：: 6.4 Dropout正则化

下一篇：: 7.卷积神经网络与计算机视觉

最新评论

7.卷积神经网络与计算机视觉
Mr.Cssust: 这篇文章深入浅出地阐述了主题，让我对这个领域有了更全面的了解。博主的细节描写非常到位，每一个点都解释得很清楚，让我在阅读过程中没有任何困惑。非常感谢博主的分享，期待看到更多精彩的文章。
7.卷积神经网络与计算机视觉
征途黯然.: The article is fantastic, and 7卷积神经网络与计算机视觉 is truly impressive.
7.卷积神经网络与计算机视觉
程序员不想敲代码啊: ✨您的文章给予了我新的启示和思考，拓宽了我对这个领域的认识，真的是一篇让人收益匪浅的好文。
6.5 Batch Normalization
程序小勇: 🌈精彩绝伦！您的文章给予了我新的启示和思考，拓宽了我对这个领域的认识，真的是一篇让人收益匪浅的好文，在这个信息爆炸的时代，有您这样用心创作的作者，真是令人欣慰，期待您的更多作品的出现，让我们共同进步，共同分享知识和智慧！
7.卷积神经网络与计算机视觉
程序小勇: 🌈精彩绝伦！您的文章给予了我新的启示和思考，拓宽了我对这个领域的认识，真的是一篇让人收益匪浅的好文，在这个信息爆炸的时代，有您这样用心创作的作者，真是令人欣慰，期待您的更多作品的出现，让我们共同进步，共同分享知识和智慧！哈哈哈，已经三连，望互关互粉，谢谢！

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。