RMSprop(吴恩达深度学习算法视频)

本文介绍了RMSPROP算法的工作原理及应用。通过调整学习速率,该算法能够在不同参数方向上实现自适应变化,从而提高训练效率。具体而言,RMSPROP通过累积历史梯度平方值来动态调整学习率,确保在陡峭曲面上收敛更稳定。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

全称是root mean sqare prop算法。
假设纵轴代表参数b,横轴代表参数w,因此我们需要减缓纵轴的波动,同时加速横轴方向的学习。
在第t次迭代过程中,mini-batch的微分dw、db会正常计算,
S_dw = β * S_dw + (1- β)(dw)2
S_db = β * S_db + (1- β)(db)2
更新参数:
w = w - α * (dw/sqr(S_dw))
b = b - α * (dw/sqr(S_db))
我们希望S_dw 会相对较小,所以我们要除以一个较小的数,而希望S_db又较大,所以我们要除以一个较大的数字,这样就可以减缓纵轴上的波动。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值