batch size的作用

本文探讨了不同Batchsize设置对梯度下降方向及模型收敛速度的影响。全样本Batch有助于确定更准确的梯度方向,但大样本Batch可能会因样本间的差异导致梯度方向不确定性增加,影响收敛。小批量Batch则能在一定程度上平衡这两者,加速模型收敛并减少震荡。

batch size 意思:每一次输入图像数的大小:
影响:对梯度下降方向有影响。

全batch:小样本 好处:全样本确定的梯度下降方向可以更好的确定梯度下降方向,更容易找到极值点。
大样本 坏处:大样本全部batch进入时,由于样本差异性,对于确定梯度方向的影响会抵消,不能找到正确的下降梯度,导致不收敛。

单独一张batch:每一个样本产生一个梯度方向,不同样本之间差异导致梯度方向可能反转很大,导致无法收敛或收敛很慢,产生震荡。

小批量batch:在一定范围内,增加batch的数量,可以使程序找到更加合适的梯度下降方向,加速收敛,减少收敛产生的震荡。
增大到一定的batch数量时候,梯度下降方向将不会变化。

实验证明:有大量样本时,小批量训练也能达到与大样本一样的收敛效果。

郁闷。。。。。。。。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值