李宏毅2021春季机器学习课程视频笔记5-模型训练不起来问题(当梯度很小的时候问题)

文章探讨了在寻找最小Loss时遇到的问题,如参数无法更新因梯度为零,可能是陷入了LocalMinima或遇到了SaddlePoint。通过泰勒展开分析CriticalPoint,使用Hessian矩阵的EigenValue来判断是LocalMinima还是SaddlePoint。在高维空间中,SaddlePoint可能比LocalMinima更常见。实验表明大多数极小点是SaddlePoint,而LocalMinima较少。
部署运行你感兴趣的模型镜像

 求解最小Loss的失败,不能得到最优的值,找不到Loss足够小的值。

  •  1.Loss关于参数的梯度为0,不能继续更新参数。(local minima 或者 saddle point)

如何知道走到了哪个点?

 利用泰勒展开:

 Critical Point的一阶导数为0

 

 举例子(Example):

 

 不需要担心Saddle Point,因为Hessian矩阵会告诉我们参数更新的方向。

 

 

 Saddle Point V.S. Local Minima

 

 三维空间这个石棺是封闭的,但是在高维空间里石棺可能是非封闭的,取到里面的东西。推广到损失函数形状,在二维空间中可能是一个Local Minima,但是转换到三位空间中其可能就是一个Saddle Point。

 实际研究,当所有的Hessian矩阵的Eigen Value都大于0时,表明这一点为Local Minima,如果有小于0的Value就表明这是一个Saddle Point。实际实验表明Local Minima最少,大多数为Saddle Point

 

您可能感兴趣的与本文相关的镜像

GPT-oss:20b

GPT-oss:20b

图文对话
Gpt-oss

GPT OSS 是OpenAI 推出的重量级开放模型,面向强推理、智能体任务以及多样化开发场景

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值