作者:中南大学可视化实验室可解释性机器学习项目组 18届 本科生研究员 WXY
日期:2020-7-16
标签: 梯度下降 误差反向传播
一、梯度下降算法
基本思想:从某些初始解出发,迭代寻找最优参数值,每次迭代中在当前点计算梯度,根据函数值下降最快的方向确定搜索方向,梯度为0则达到局部极小。


J是代价函数,w是权重,b是一个常数类似于阈值,当我们从一个初始点出发,向梯度最大的方向一步一步前进,最终会到达最小值

全局最小与局部极小
这张图是一个凸函数,但是如果在非凸最优化,类似于这张图

直接采取梯度下降或许就不能到达全局最小
跳出局部极小的策略
以多组不同参数值初始化多个神经网络,取其中误差最小的解作为最终参数。
模拟退火simulated annealing:每一步都以一定的概率接受比当前

本文深入探讨了梯度下降算法的基本思想及其在机器学习中的应用,并介绍了BP算法的工作原理,包括误差的前向传播与反向传播过程。此外,还讨论了避免过拟合的策略如早停与正则化。
最低0.47元/天 解锁文章
762

被折叠的 条评论
为什么被折叠?



