关于epoch,batch size,和iteration

文章解释了在训练神经网络时,epoch表示完整遍历数据集的次数,batchsize是每次输入网络的数据量,而iteration是数据集被划分的次数。举例说明了如何计算这些参数的关系,并用吃饭的例子形象地比喻了它们的区别。同时提到了硬件限制(如GPU内存)对训练过程的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一个epoch 指的是把所有训练数据丢进神经网络一次。

由于训练数据常常太大了,不能够一次全部输入进去处理,得慢慢来,所以我们常常把训练数据分成好几等份,分完之后每份数据的数量就是 batch size,而数据共被分为了iteration等份。

epoch指的是次数,epoch = 10 指的是把整个数据集丢进神经网络训练10次。

batch size 指的是数据的个数,batch size = 10 指的是每次扔进神经网络训练的数据是10个。

iteration同样指的是次数,iteration = 10 指的是把整个数据集分成10次扔进神经网络。

Example

Q: 如果你有100个训练数据,epoch = 10, batch size = 5, iteration = ?

A : iteration = 总共100 个数据/每次5个数据 = 20 次

也就是说,你要把100个数据集扔进神经网络训练10次,每次(每个epoch)你要把100个数据集分成20份,每份数据为5个(batch size=5),所以你需要投入20次(iteration)来完成一个epoch。

这就好像我们人吃饭,假设每天食物摄入量是固定的(数据总量,也就是一个epoch),我们可以少吃多餐,这种情况下无论是每天吃5餐还是10餐(即iteration),其实不是那么重要,因为这种情况下每餐吃的都是比较少的,没什么负担。

但如果你一餐就要把一天的量都给干了,那就可能吃撑了,或者吃吐了,这时候吃不吃得下,就取决于对你的胃容量(GPUmemory,显存)的大小。

 

参考原文:快速搞定 epoch, batch, iteration - 知乎 (zhihu.com)

Epoch(轮)是指将训练集中的所有样本全部使用一遍的训练过程。在深度学习中,训练集通常会被分成多个批Batch),每个批作为一个小的数据集进行训练。当所有的批训练完成后,就完成了一个Epoch训练Epoch的数量通常是一个超参数,需要在训练前手动设置。 Batch(批)是指在训练过程中,将训练集分成的若干个小批(mini-batch),每个小批都会经过一前向传播反向传播的过程。一个Batch中的数据量可以根据实际情况进行设置,通常是根据计算资源模型性能来确定。 Iteration(迭代)是指对一个小的数据集(Batch)进行一训练的过程。在深度学习中,通常将一个Batch中的数据分为若干个小批(mini-batch),每个小批都会经过一前向传播反向传播的过程,这个过程就是一迭代(Iteration)。通常,一个Epoch包含多个Iteration。 所以,Epoch是整个数据集上的一训练Batch是对数据集进行分批处理,而Iteration是对一个小批数据进行一训练。它们三者是深度学习训练模型时的基本单位,每个单位都有自己特定的含义作用。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [BatchEpochIteration](https://blog.youkuaiyun.com/VIAww/article/details/129911981)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值