机器学习模型中step与epoch，batch_size之间的关系

最新推荐文章于 2025-10-29 10:01:23 发布

原创

最新推荐文章于 2025-10-29 10:01:23 发布 · 1.9w 阅读

67 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #深度学习 #机器学习 #人工智能 #tensorflow

本文探讨了机器学习模型中step、epoch和batch_size的概念。step指的是梯度更新的过程，一个epoch内，若每批数据(batch_size)为100，而总数据量为2000，则需要20个step完成一个epoch。通过理解这些参数，可以更好地调整学习率以优化模型训练。

本文主要谈谈自己对step，epoch，batch_size这几个常见参数的理解。
最近在调试模型的时候，发现在使用keras.optimizer.adam时，模型在添加了新的一层2D卷积层后难以收敛，在不调整初始权重矩阵的情况下，想通过衰减学习率来使loss function的收敛性更好。

tf.keras.optimizers.Adam(
    learning_rate=0.001,
    beta_1=0.9,
    beta_2=0.999,
    epsilon=1e-07,
    amsgrad=False,
    name="Adam",
    **kwargs
)

可以看到，adam这个optimizer在没有其他参数条件的情况下，默认学习率为固定0.001。

为了调整学习率，在keras的文档中找到了下述示例代码，代码的意思很简单，初始学习率为0.01，衰减需要的step为10000，衰减率为0.9，即每次经过10000 steps，学习率就衰减为原来的0.9。

lr_schedule = keras.optimizers

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Cy_coding

关注关注

34
点赞
踩
67

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

详解step、iteration、batch_size、epoch

herosunly的博客

01-18

8万+

今天给大家带来的文章是详解step、batch_size、iteration、epoch，希望能对学习机器学习的同学们有所帮助。文章目录 1. 前言 2. 宏观理解 3. 概念细致理解

Keras-ImageDataGenerator的flow()中的batch_size参数，Model.fit()中的batch_size和steps_per_epoch参数的关系

q2972112的博客

12-22

6239

Keras-ImageDataGenerator的flow()中的batch_size参数，Model.fit()中的batch_size和steps_per_epoch参数的关系

2 条评论您还未登录，请先登录后发表或查看评论

Epoch、Step和BatchSize的区别

码匀的博客

08-13

7573

今天用Tensororad的时候突然想到这个问题，记下来：这里的横轴都知道应该是step。那么举个例子：1000张图片，每次训练10个。 Epoch：这一千张图片全部训练完成一次即为一个Epoch。 Step：1000/10 即为step，表示要更新多少次梯度。 BatchSize：这里的10 即为batchsize。这里是每隔十次就更新一次梯度，也就是将一个batch中的图片一张张送入模型，累加loss求平均，到了第十张图片的时候就开始反向传播。拙见，如有错误，烦请评论区告知。 ...

【机器学习】Epoch（训练轮数）和Step（迭代次数）

fzy2003的博客

09-18

1万+

Epoch（训练轮数）和 Step（迭代次数）是深度学习中训练模型的两个关键概念。Epoch 指模型在训练过程中遍历整个训练数据集一次，即对所有样本完成一次前向传播和反向传播。在一个 Epoch 中，模型会看到每个训练样本一次。Step（迭代）是模型使用一个批次（Batch）数据进行一次参数更新的过程，每处理一个 Batch，就是一个 Step。

【机器学习】Epoch在机器学习中的意思？详细解释

最新发布

wq6qeg88的博客

10-29

800

Epoch（时期/周期）是机器学习中的重要概念，指模型完整遍历一次训练集的过程。它与Batch（批次）和Iteration（迭代）密切相关：1个Epoch包含(总样本数/BatchSize)次Iterations。采用多个Epoch的原因包括：梯度下降是渐进过程、小批量训练存在噪声、需要平衡欠拟合与过拟合。典型训练流程中，Epoch是外层循环，内层循环遍历所有Batches进行参数更新。实际应用中需监控损失曲线，适时停止训练以避免过拟合。

TensorFlow框架中batch、batch_size、iteration、step和epoch间的关系与意义

xunyishuai5020的博客

12-24

5335

1、定义与关系 batch（批）：batch源自小批量随机梯度下降算法（mini-batch SGD）中，每次更新迭代模型参数时仅使用全部训练集样本中的一小部分，这部分被使用的样本数据叫做一个batch batch_size（批大小）：小批量随机梯度下降法（mini-batch SGD）中，每次更新模型参数所使用的样本数量，即一个batch中所包含的样本数量。 iteration（迭代）：模型训练中，更新模型参数的次数；iteration = batch number * epoch number step

step，epoch，batch_size关系

greenlxh的博客

03-03

960

step，epoch，batch_size关系

epoch和step关系

ttest11的博客

06-13

508

epoch （轮，周期）：step （步，迭代步）：假设你有：每一个epoch会有的总step数：steps per epoch=⌈BN⌉T个epoch总共多少step？总step数=T×⌈BN⌉比如你有10000条训练数据，batch_size=32。每个epoch要：取整，每个epoch有313个step 。如果训练10个epoch，总共：

神经网络：Epoch、Batch Size和迭代

paddle video_tag模型踩坑

06-16

4696

Epoch、Batch Size和迭代 深度学习模型离不开这3个术语，下面我们来了解下它们的区别和联系？背景知识：梯度下降分三点：1.直观理解 2. 梯度下降怎么做（附带推荐编程实践） 3. 梯度下降有啥用 1、直观理解梯度下降：其实它没啥就是让计算机不断猜最小值的那个点自变量x在哪，猜大了让它小一点，猜小了让它大一点。主要三点： 1.梯度下降：两个意思，1.根据梯度（导数）的符号来判断最小值点x在哪;让函数值下降（变小） 2.梯度就是导数（对于多维就是偏导数） 3.梯度下降作用是找到函数的最小

从 SGD 到梯度累积：Epoch、Batch、Step 的关系全解析

2501_92532948的博客

08-19

1034

Epoch、Batch 和 Step 之间的关系以及梯度累积

神经网络 专业术语解释（Step、Batch Size、Iteration、Epoch）

learn more，have more

03-07

2274

Step、Batch Size、Iteration、Epoch

Epoch、Batch、Step 之间的关系

Hoper-J的博客

12-16

3054

了解 Epoch/Batch/Step 之间的关系

关于深度学习中的batch、epoch、step理解

Yo0130的博客

12-12

4458

则训练完一次50000张图片就是1个epoch，一般模型需要多轮训练，例如即将epoch设置为200，则完成训练需要将50000张图片遍历200轮。该网络每隔36次就更新一次梯度，也就是将一个batch_size中的图片一张张送入模型，累加loss求平均，到了第十张图片的时候就开始反向传播。若batch_size为36，则网络一次训练36张图片，训练完成后，得到Loss，并更新模型权重。那么，完成一个epoch的训练需要50000/36=1388.8888，则step为1389。

step(iter)、epoch、batch size的计算关系

m0_61899108的博客

11-18

1669

step(iter)、epoch、batch size之间的关系公式。

怎么推算max_step和epoch之间关系，例如多少step一个epoch

大模型天花板

11-08

2626

（轮次）之间的关系取决于您的训练流程和超参数设置。通常情况下，一个step通常表示对一个batch的训练，而epoch则表示一次完整的数据集训练。是您希望运行的轮次数量。这个公式假设每个step处理一个batch数据，其中，总训练样本数是您的训练数据集中的样本总数，表示遍历整个数据集的次数。

深度学习中使用的batchsize, step(iteration), epoch 含义以及其关系

热门推荐

Congying-Wang的博客

05-10

1万+

变量含义 epoch 一个epoch表示所有训练样本运算学习一遍 iteration/step 表示每运行一个iteration/step，更新一次参数权重，即进行一次学习，每一次更新参数需要batch size个样本进行运算学习，根据运算结果调整更新一次参数。 batch size 1次迭代所使用的样本量其关系为： iteration=exampleNums∗ep...

step，batch，epoch名词解释

touristourist的博客

08-13

1487

转载自：https://www.jianshu.com/p/78646919ed20 1. 名词解释 Step: 训练模型的步数 Batch Size（批尺寸）：计算梯度所需的样本数量，太小会导致效率低下，无法收敛。太大会导致内存撑不住，Batch Size增大到一定程度后，其下降方向变化很小了，所以Batch Size是一个很重要的参数。为什么需要有 Batch_Size : ba...

机器学习epoch,batch,batchSize,step

taylar1357的博客

04-14

5039

epoch表示迭代周期，batchs表示批次数,一个epoch表示模型遍历并处理过所有样本一次; batch表示批次数，批次数 = 样本个数 /batchSize; batchSize表示批次大小，如bathSize=5，代表模型处理完5个样本后，进行一次前向传播和反向传播; step表示模型步数。step = epoch * batchSize。以上内容纯属自我总结，如有不对...

概念辨析: step, iteration, epoch, batchsize

miles_ye的博客

04-07

2950

引言 step, iteration, epoch, batchsize, learning rate都是针对模型训练而言的，是模型训练中设置的超参数。样本 step, 也称为iteration 通常被译为迭代，每次迭代会更新模型的参数 epoch 通常被译为轮数，是指训练数据集中的所有样本（数据）输入模型被“轮”（即训练）的次数。为什么需要多个epoch？模型训练需要将训练集数据在模型中训...

batch_size大小和数据集大小的关系

06-06

在深度学习和机器学习中，Batch_Size 是一个关键的超参数，它直接影响模型训练的效率、效果以及内存使用情况。以下是关于 Batch_Size 与数据集大小之间关系的详细分析： #### 1. 数据集大小对 Batch_Size 的选择 - ...