BatchNorm与LayerNorm

最新推荐文章于 2025-07-12 11:41:56 发布

胖胖大海

最新推荐文章于 2025-07-12 11:41:56 发布

阅读量1.6k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习深度学习正则化文章标签： BatchNorm LayerNorm LRN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/cxx654/article/details/123197287

深度学习同时被 3 个专栏收录

83 篇文章

订阅专栏

34 篇文章

订阅专栏

2 篇文章

订阅专栏

本文详细介绍了深度学习中的三种归一化技术：BatchNorm、LayerNorm和LocalResponseNorm。BatchNorm对每个神经元在批次维度上的输出进行归一化，而LayerNorm则是对整个层的所有神经元进行归一化。LocalResponseNorm则是一种局部响应归一化，用于神经网络的激活层。它们的主要区别在于归一化的范围和方式，BatchNorm沿批次维度，LayerNorm沿层维度。这些技术有助于优化网络训练，减少内部协变量位移并提高模型的泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

BatchNorm批量归一化：批量归一化是对一个中间层的单个神经元进行归一化操作。计算第l层网络中每个神经元在Batch大小为N的样本上输出的N个结果，计算每个神经元输出的N个结果的均值和方差，然后使用均值和方差来对这N个输出结果做归一化，所以归一化的维度是在Batch上进行的

LayerNorm层归一化：层归一化是对一个中间层的所有神经元进行归一化。计算第l层网络中的每个神经元在Batch中每个输入样本的输出，对于每个输入样本，计算所有神经元输出结果的均值和方差，使用均值和方差来归一化对于这个输入样本的输出结果，所以归一化的维度以在整个层上进行的

LocalResponseNorm局部响应归一化：

区别：层归一化和批量归一化整体上是十分类似的，差别在于归一化的方法不同。对于K个样本的一个Batch集合：

层归一化是对矩阵的每一列进行归一化（也就是在整个层上），批量归一化是对每一行进行归一化（也就是在整个Batch的每个维度上）。

BatchNorm和LayerNorm图解：

假设神经网络的某全连接层有M个神经元，输入Batch大小为N:

博客等级

码龄14年

141
原创

795
点赞

3382
收藏

314
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: pytorch版本RetinaFace人脸检测模型推理加速

下一篇：: Yolo系列目标检测算法知识点总结

最新评论

《Non-local Neural Networks》个人总结理解
xxyh1993: 具体计算量，只要了解的，就可以计算出NL比SA计算量还大。说白了，NL是把每个像素点看做token/节点。但是，如果采用Q(K_T·V)的线性方式，NL和SA计算量会下降很多，但是NL都比SA计算量大。
《Non-local Neural Networks》个人总结理解
xxyh1993: 我后面仔细算了一下，如果non-local采用多头的计算方式，其计算量比SA还多
《Non-local Neural Networks》个人总结理解
xxyh1993: Non-local Neural Networks最明显的特点是不需要位置编码。本质上，non-local是self-attention的重要实现，与transformer的注意力没有本质区别。另外，non-local也可以看做一种简化的图卷积。因为它把每个像素点看成一个点，通过QKV的方式计算边权重。
《Non-local Neural Networks》个人总结理解
xxyh1993: Non-local Neural Networks最明显的特点是不需要位置编码。本质上，non-local是self-attention的重要实现，与transformer的注意力没有本质区别。另外，non-local也可以看做一种简化的图卷积。因为它把每个像素点看成一个点，通过QKV的方式计算边权重。
Transformer Block运算量
xxyh1993: 计算机视觉里面的transfomer一般是QKV的维度都是相等的。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。