优化方法

1. Mini-batch

batchsize=1 时,就是“stochastic gradient descent (SGD)”;
batchsize=m 时,就是“batch gradient descent (BGD)”;

优点缺点
SGD更新一次参数的速度很快-走的很快收敛路线“波动很大”,可能导致无法收敛到全局最优
BGD收敛路线“平稳”,每次都向着正确方向走更新一次参数的速度很慢-走的很慢

于是中和两者优缺点,将batchsize设定在1~m之间。

2. Momentum

一种梯度更新方法,作用为平滑SGD或Mini-BGD带来的收敛过程的波动。

如下图,由蓝色波动变成红色波动。

更新方式如下:

{vdW[l]=βvdW[l]+(1β)dW[l]W[l]=W[l]αvdW[l]

3. RMSprop

另一种梯度更新方法,作用为平滑SGD或Mini-BGD带来的收敛过程的波动。与Momentum的作用一样。

如下图,由蓝色波动变成绿色波动。

更新过程如下:

sdW[l]=β2sdW[l]+(1β2)(dW[l])2W[l]=W[l]αdW[l]sdW[l]+ε

4. Adam

另一种梯度更新方法,作用为平滑SGD或Mini-BGD带来的收敛过程的波动。是momentum和RMSprop的结合。

更新过程如下:

vdW[l]=β1vdW[l]+(1β1)W[l]vcorrecteddW[l]=vdW[l]1(β1)tsdW[l]=β2sdW[l]+(1β2)(W[l])2scorrecteddW[l]=sdW[l]1(β2)tW[l]=W[l]αvcorrecteddW[l]scorrecteddW[l]+ε

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值