Pytorch:动量与学习率

本文介绍了PyTorch中动量(momentum)的概念,它是权重更新的一个惯性机制,结合了当前梯度和历史梯度的影响。此外,还讨论了学习率衰减(learning rate decay)的策略,包括根据loss变化动态调整和固定步长的周期性衰减,并给出了具体代码实现的例子。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

(1)动量:momentum,也可以说是惯性

w^{k+1}= w^{k}-\alpha \bigtriangledown f\left ( w^{k} \right ),经过z^{k+1}=\beta z^{k}+\bigtriangledown f\left ( w^{k} \right )变为w^{k+1}=w^{k}-\alpha z^{k+1}

也就是说,权值w现在不只想着\bigtriangledown f的方向衰减,也向着

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值