机器学习中常见的最优化算法
牛顿法与梯度下降法
1、从收敛速度
梯度下降法属于一阶收敛,牛顿法属于二阶收敛,牛顿法收敛速度更快。
梯度下降只考虑方向,牛顿法不仅考虑方向,还兼顾步子的大小
2、从几何上
梯度下降用一个平面拟合当前局部曲面
牛顿法用一个二次曲面拟合当前局部曲面
牛顿法选择的路径更符合真实路径
梯度下降法属于一阶收敛,牛顿法属于二阶收敛,牛顿法收敛速度更快。
梯度下降只考虑方向,牛顿法不仅考虑方向,还兼顾步子的大小
梯度下降用一个平面拟合当前局部曲面
牛顿法用一个二次曲面拟合当前局部曲面
牛顿法选择的路径更符合真实路径