机器学习中Batch Size、Iteration和Epoch的概念

最新推荐文章于 2025-10-29 10:01:23 发布

转载最新推荐文章于 2025-10-29 10:01:23 发布 · 2.4k 阅读

12 ·

CC 4.0 BY-SA版权

原文链接：https://blog.youkuaiyun.com/taylar1357/article/details/89303983

文章标签：

#机器学习

o 专栏收录该内容

1 篇文章

订阅专栏

本文深入解析了机器学习中BatchSize、Iteration和Epoch的概念，探讨了它们如何影响神经网络的训练过程，包括权重更新、拟合状态及过拟合现象。通过对比不同设置下的训练结果，阐述了这些参数的重要性。

机器学习中Batch Size、Iteration和Epoch的概念

Epoch一个epoch指代所有的数据送入网络中完成一次前向计算及反向传播的过程。由于一个epoch常常太大，计算机无法负荷，我们会将它分成几个较小的batches。那么，为什么我们需要多个epoch呢？我们都知道，在训练时，将所有数据迭代训练一次是不够的，需要反复多次才能拟合收敛。在实际训练时，我们将所有数据分成几个batch，每次送入一部分数据，梯度下降本身就是一个迭代过程，所以单个epoch更新权重是不够的。下图展示了使用不同个数epoch训练导致的结果。

在这里插入图片描述

可见，随着epoch数量的增加，神经网络中权重更新迭代的次数增多，曲线从最开始的不拟合状态，慢慢进入优化拟合状态，最终进入过拟合。因此，epoch的个数是非常重要的。那么究竟设置为多少才合适呢？恐怕没有一个确切的答案。对于不同的数据库来说，epoch数量是不同的。但是，epoch大小与数据集的多样化程度有关，多样化程度越强，epoch应该越大。Batch Size所谓Batch就是每次送入网络中训练的一部分数据，而Batch Size就是每个batch中训练样本的数量上文提及，每次送入训练的不是所有数据而是一小部分数据，另外，batch size 和batch numbers不是同一个概念~Batch size大小的选择也至关重要。为了在内存效率和内存容量之间寻求最佳平衡，batch size应该精心设置，从而最优化网络模型的性能及速度。下图为batch size不同数据带来的训练结果，其中，蓝色为所有数据一并送入训练，也就是只有1个batch，batch内包含所有训练样本。绿色为minibatch，即将所有数据分为若干个batch，每个batch内包含一小部分训练样本。红色为随机训练，即每个batch内只有1个训练样本。

在这里插入图片描述

上图可见，蓝色全数据效果更好，当数据量较小，计算机可以承载的时候可以采取这种训练方式。绿色的mini分批次训练精度略有损失，而红色的随机训练，难以达到收敛状态。Iterations所谓iterations就是完成一次epoch所需的batch个数。刚刚提到的，batch numbers就是iterations。简单一句话说就是，我们有2000个数据，分成4个batch，那么batch size就是500。运行所有的数据进行训练，完成1个epoch，需要进行4次iterations。

作者：XDTY17_LK
链接：https://www.jianshu.com/p/e5076a56946c/
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

epoch表示迭代周期，batchs表示批次数,一个epoch表示模型遍历并处理过所有样本一次;

batch表示批次数，批次数 = 样本个数 /batchSize ;

batchSize表示批次大小，如bathSize=5，代表模型处理完5个样本后，进行一次前向传播和反向传播;

step表示模型步数。step = epoch * batchSize。

https://blog.youkuaiyun.com/taylar1357/article/details/89303983