学习链接:https://blog.youkuaiyun.com/Solo95/article/details/84842144
1、指数加权平均:
2、使用动量的梯度下降:
3、RMSprop算法:
4、Adam算法:
dw相当于一阶矩,平方相当于二阶矩。
没了,就是这么简单
学习链接:https://blog.youkuaiyun.com/Solo95/article/details/84842144
1、指数加权平均:
2、使用动量的梯度下降:
3、RMSprop算法:
4、Adam算法:
dw相当于一阶矩,平方相当于二阶矩。
没了,就是这么简单