BatchNorm论文阅读笔记

最新推荐文章于 2025-08-02 16:41:35 发布

原创

最新推荐文章于 2025-08-02 16:41:35 发布 · 900 阅读

1 ·

CC 4.0 BY-SA版权

前言

BatchNorm作为深度学习训练的一个大杀器，重要性还是不言而喻的。最近学习了一下BatchNorm的论文，简单记录一下以便复习。论文中的好多公式推导都没看明白，只能结合吴恩达深度学习的讲解，写一些感性上的认识吧。下面这篇博客讲的很好，我就在它的基础上补充一下好了。
　　深入理解Batch Normalization批标准化
　　 BatchNorm论文下载传送门

BatchNorm论文阅读笔记

Abstract

在训练的时候，由于前面层的权重更新，后面每一层的输入的分布会发生变化，这导致训练深度神经网络非常困难。需要设置较小的学习率和一定的权重初始化方法来应对这个问题。我们将这种现象称为internal covariate shift。我们提出了一种归一化方法，将这种方法整合到网络结构中，并在训练时每个mini-batch上进行归一化，来解决这个问题。BatchNorm可以使我们在训练时使用更大的学习率，并且网络初始化方法不需要像以前那样很careful，并具有一定的正则化效应。