Tensorflow基础4-(epoch, iteration和batchsize)

本文详细解释了深度学习训练过程中的关键概念,包括batchsize、iteration和epoch的区别与联系,以及它们如何影响模型的训练效率和性能。
  • batchsize:批大小。在深度学习中,一般采用SGD训练,
    即每次训练在训练集中取batchsize个样本训练;
  • iteration:1个iteration等于使用batchsize个样本训练一次;
  • epoch:1个epoch等于使用训练集中的全部样本训练一次;

举个例子,训练集有1000个样本,batchsize=10,那么:
训练完整个样本集需要:100次iteration,1次epoch。

2、
one epoch:所有的训练样本完成一次Forword运算以及一次BP运算
batch size:一次Forword运算以及BP运算中所需要的训练样本数目,其实深度学习每一次参数的更新所需要损失函数并不是由一个{data:label}获得的,而是由一组数据加权得到的,这一组数据的数量就是[batch size]。当然batch size 越大,所需的内存就越大,要量力而行
iterations(迭代):每一次迭代都是一次权重更新,每一次权重更新需要batch size个数据进行Forward运算得到损失函数,再BP算法更新参数。

最后可以得到一个公式:
one epoch = numbers of iterations = N = 训练样本的数量/batch size

一次epoch 总处理数量 = iterations次数 * batch_size大小

### 深度学习中 EpochIteration Batch Size 的概念及区别 #### 定义与关系 - **Batch Size** 是指一次训练所选取的样本数。通常情况下,这个数值设置为2的幂次方形式,例如32、64或128等[^2]。 - **Epoch** 表示整个数据集被完整遍历一遍的过程,在此期间模型会看到所有的训练样例并更新权重参数多次。每一次完整的遍历称为一个 epoch[^1]。 - **Iteration** 则是指完成单个 batch 训练所需的次数,也就是在一个 epoch 内处理完所有批次所需要经历的轮次。具体来说就是总样本数除以 batch size 得到的结果[^4]。 这些术语之间的关联在于它们共同描述了一个典型的机器学习算法如何逐步优化其性能的方式: 当执行一轮 epoch 时,程序将按照设定好的 batch size 来分割输入的数据集合,并依次对每一个子集(batch)应用反向传播来调整网络内部连接强度直至达到预设条件为止;而每经过一批新的实例之后就构成了一次 iteration。 ```python import numpy as np def train_model(data, epochs=10, batch_size=32): total_samples = len(data) for epoch in range(epochs): # Shuffle data at each new epoch start. np.random.shuffle(data) iterations_per_epoch = (total_samples + batch_size - 1) // batch_size for iter_num in range(iterations_per_epoch): batch_start = iter_num * batch_size batch_end = min((iter_num + 1) * batch_size, total_samples) current_batch = data[batch_start : batch_end] # Perform forward pass and backward propagation here using `current_batch`. ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值