Keras深度学习实战（5）——批归一化详解

盼小辉丶

已于 2024-08-13 21:55:57 修改

阅读量9k

点赞数 15

CC 4.0 BY-SA版权

分类专栏： Keras深度学习从入门到项目实战文章标签：深度学习 keras 人工智能

于 2022-05-01 10:51:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/LOVEmy134611/article/details/124524005

Keras深度学习从入门到项目实战专栏收录该内容

60 篇文章 ¥29.90 ¥99.00

订阅专栏

本文介绍了批归一化在神经网络中的作用，它能加快网络训练速度并提高泛化能力，缓解过拟合。批归一化通过对批次数据进行均值和方差计算，然后缩放输入值来优化网络性能。文章通过实例展示了在Keras中如何使用批归一化，并比较了使用批归一化前后的训练效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Keras深度学习实战（5）——批归一化详解

0. 前言

批归一化是神经网络中关键性技术之一，使用批归一化可以大幅加快网络的收敛，同时提高网络的泛化能力，也就说，批归一化可以用于缓解模型的过拟合问题。

1. 批归一化基本概念

在《神经网络模型性能优化技术》中，我们了解到，如果不缩放输入数据，则权重优化的速度很慢。这是由于当面临以下情况时，隐藏层的值可能会很过大：

输入数据值较大
权重值较大
权重和输入的乘积结果较大

以上任何一种情况都可能导致隐藏层具有较大输出值，隐藏层可以视为输出层的输入层。因此，当隐藏层值也很大时，同样会导致网络优化缓慢，批归一化 (Batch Normalization, BN) 的提出就是为了解决这一问题。
我们简单回顾下批训练的概念，一般在网络的计算过程中会同时计算多个样本，这种训练方式叫做批训练，其中一个批中样本的数量叫做 Batch Size。我们已经了解到，当输入值很高时，我们可以通过使用缩放以减小输入值。此外，我们也了解了多种数据缩放的方法，其中包括减去输入的平均值并将其除以输入的标准差，而批归一化就是使用这种缩放的方法。通常，首先使用以下公式计算网络层批数据的均值和方差：

了解本专栏

评论 12

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

盼小辉丶 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。