【AI面试】BN（Batch Norm）批量归一化

钱多多先森

已于 2024-11-06 20:45:25 修改

阅读量1k

点赞数

CC 4.0 BY-SA版权

分类专栏： 7天快速通过AI/CV面试文章标签： batch 深度学习人工智能

于 2023-04-02 16:17:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/wsLJQian/article/details/126375702

7天快速通过AI/CV面试专栏收录该内容

32 篇文章 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

批量归一化（BN）是为了解决深度学习中内部协变量转移问题，加速训练并提高模型性能。BN通过计算批次数据的均值和方差进行归一化，然后应用可学习的参数进行调整。它通常应用于全连接层和卷积层的激活函数前。在推理阶段，使用训练阶段统计的全局均值和方差。BN与Layer Normalization（LN）的区别在于BN沿通道维度归一化，而LN对每个样本的所有通道进行归一化。BN在图像处理中表现良好，而在NLP中，LN可能更合适。

文章目录

一、批量归一化概念
二、推理阶段
三、代码实现
四、其他形式的Normalization
五、总结及问题

在提到批量归一化的面试问题时候，一般会以以下几种形式提问：

为什么要引入BN？
BN解决了什么问题？
BN的公式是怎样的？
BN公式中，有哪些参数是可学的？
BN中，均值和方差的尺寸shape是什么样子的？
BN在训练阶段和验证阶段，有什么不同？

本文就围绕上述的问题，展开来说，希望对你有帮助。如果真有，麻烦给个赞👍，支持一波。

后面的内容主要是学习了沐神的视频，进行了一些理解和补充。感兴趣的可以直接去看原视频，视频链接：批量归一化【动手学深度学习v2】

一、批量归一化概念

1.1、为什么要引入批量归一化

我们都知道：

数据forward阶段，从下往上，输入数据，得到结果做预测

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

钱多多先森 你的鼓励，是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。