深度学习中的优化方法

本文详细介绍了深度学习中的优化方法,包括梯度下降、随机梯度下降、Mini-batch梯度下降、Momentum以及Adam优化算法。通过理解这些方法,可以更好地训练神经网络,提高模型的收敛速度和性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

1.梯度下降

2.随机梯度下降

3.Mini-batch梯度下降

4.Momentum

5.Adam


1.梯度下降

即每一步在所有m个样本上更新一次梯度,也称作批量梯度下降(Batch Gradient Descent)。

对于l=1,2,...,L

其中,L是神经网络的层数,\alpha是学习率。

2.随机梯度下降

相当于每一个batch只有一个样本的mini-batch,更新策略与梯度下降大致相同,不同的是每一次只在一个训练样本上计算梯度,而不是整个训练集上。

在随机梯度下降中,更新梯度之前只用了一个训练样本,所以当训练集很大时,随机梯度下降更快。但参数会朝着最小值的方向波动而不是平滑地收敛,如图:

3.Mini-batch梯度下降

Mini-batch梯度下降每一步使用了介于整个训练集和一个训练样本之间的样本数量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值