batch_size参数设置

最新推荐文章于 2025-03-29 16:40:09 发布

Suodislie

最新推荐文章于 2025-03-29 16:40:09 发布

阅读量1.5w

点赞数 5

分类专栏：神经网络

本文链接：https://blog.youkuaiyun.com/Suodislie/article/details/72301559

版权

神经网络专栏收录该内容

4 篇文章

订阅专栏

本文介绍了Batch_size的概念及其对模型训练的影响，包括内存利用率、迭代次数、下降方向准确性等方面，并探讨了不同Batch_size的选择策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Batch_size：

定义：一次性读入多少批量的图片，不是样本。

Full Batch Learning：Batch_size=数据集大小，适用于小数据集。
Mini-batches Learning：Batch_size= N（自己设定），适用于大数据集。
Online Learning（在线学习）：Batch_size=1，

如何选择Batch_size？

A：一定范围内增大Batch_size：

1、提高了内存的利用率，大矩阵乘法的并行化效率提高
2、跑完一次epoch所需要的迭代次数减少，相同数据量的数据处理速度加快。
3、 Batch_size越大下降方向越准，引起的训练震荡越小。
4、缺点：内存溢出、训练时间增加、收敛缓慢、局部最优，泛化性差
B：Batch_size过小：修正方向以各自样本的梯度方向修正难以达到收敛。