Epoch 和 Batch

最新推荐文章于 2025-05-29 14:16:32 发布

原创最新推荐文章于 2025-05-29 14:16:32 发布 · 438 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#AI #Deep learning #SGD #Epoch #Batch

AI 专栏收录该内容

4 篇文章

订阅专栏

本文深入解析了机器学习中Batchsize与Epoch的概念，解释了它们在训练过程中的作用及如何影响权重更新，对于理解SGD优化算法至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天在看keras的文档的时候看到行代码：

model.fit(x_train, y_train, epochs=5, batch_size=32)

epochs和batch_size，忽然有点迷糊，知道是两个很重要的hyper parameter, 具体指什么想不起来了，赶紧查了下，以备后用。

依然是几个重要的名词：

Batch size，Epoch

这两个参数是SGD中的超参，假定有一个training dataset, size = 10000

Epoch：

当整个training dataset 都向前通过（forward：Calculate）一次网络，然后再向后（backward： Back propagation）通过一次网络, 这叫一个Epoch。

一般training中会有不止一个Epoch，就是说training dataset会多次的通过网络，这是因为training dataset里样本数量有限，如果只有一个Epoch，也许并不能获取到满意的W（Weight），所以多次，但Epoch的值是不确定的，跟training dataset有关系。

Batch:

因为整个training dataset的数据量过大，如果一次让这么大的数据量通过网络然后才进行一次Weight的update，那太慢了。所以一般会把整个training dataset分成若干的batch： batch_size x iteration = training dataset.

所以batch的定义就是：一批用于training的样本，在这批样本通过网络以后Weight会进行一次更新。