李宏毅深度学习——机器学习训练(三)批次batch和动量momentum

本文探讨了在机器学习中,批量大小(batch size)如何影响梯度下降过程,包括可能导致的局部最小值、鞍点问题以及不同batch大小在损失函数上的表现。此外,文章还介绍了动量(momentum)的概念,它通过结合历史梯度来加速学习过程,避免在平缓区域和局部最小值处停滞。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一.batch size

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

 当采用较小的梯度进行梯度下降时可能会出现:

1.梯度在损失函数较为平缓段,下降速度十分缓慢

2.梯度下降停在鞍点

3.梯度下降停在局部最小值

当使用批量优化处理梯度时

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16然而,不同batch对于梯度处理有较大影响。虽然在使用gpu处理不同大小batch的时间并没有太大差距(下左图),但当一个epoch含有的batch越多,处理一个epoch所需输入的batch数越多,时间也越长(下右图)。

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

 然而,batch并

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值