- 博客(2)
- 收藏
- 关注
原创 Datawhale X 李宏毅苹果书 AI夏令营 Task 1
参数的数量代表了误差表面的维度。这个是优化的问题,大的批量大小优化可能会有问题,小的批量大小优化的结果反而是比较好的。书上说的计算方法大家可能看着有点不太能理解,我之前学矩阵的时候其实也不太理解,其实就是我们得到一个海森矩阵后,直接对海森矩阵就行判断就可以了,书上的方法就是判断海森矩阵的特征值,其实还可以通过矩阵的各阶顺序主子式来进行判断。鞍点相对于局部极小值点来说更好处理,因为对于鞍点来说,我们只要一个负的特征值,让后找出这个负的特征值对应的特征向量,沿着这个方向更新我们的参数就可以逃离鞍点,继续优化。
2024-08-27 22:18:16
1098
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1