DL是在一个非常高维的世界里做梯度下降。局部最小值很难形成,因为局部最小值要求函数在所有维度上都是局部最小。更实际得情况是,函数会落到一个鞍点上,如下图:
理解DL的局部最小
最新推荐文章于 2025-05-13 16:13:19 发布
DL是在一个非常高维的世界里做梯度下降。局部最小值很难形成,因为局部最小值要求函数在所有维度上都是局部最小。更实际得情况是,函数会落到一个鞍点上,如下图: