BN
- batch normalization,使之在激活函数接收输入之前将数据的分布规范到标准正态分布中,使得激活函数的输入值落在对输入比较敏感的区域,也就是梯度较大的区域。从而避免梯度消失、减少训练时间。
- BN比较适合batch较大的场景,并且数据分布要相对比较接近。
WN
- weigit normalization,主要就是对网络的权重进行正则化,使得网络不要过于复杂,权重不要过大,可以防止过拟合。
LN
- layer normalization,它相对于BN,不依赖于整个batch,而是针对某一层的输入进行规范化处理,比较适用于小batch、RNN、MLP场景中。
博主会持续更新一些深度学习相关的基础知识以及工作中遇到的问题和感悟,喜欢请关注、点赞、收藏。