Lesson 2 what to do if your network fails to train

本文是关于李宏毅老师课程的笔记,讨论了模型训练结果不佳时如何区分是模型偏见(Modelbias)还是优化问题。强调了检查训练集和测试集性能的重要性,以及如何通过从浅层网络开始分析来判断问题所在。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

听课(李宏毅老师的)笔记,方便梳理框架,以作复习之用。本节课主要讲了遇到模型训练结果不好的时候该怎么快速判断哪里出了问题,以及部分的应对方法

1. General Guidance

在这里插入图片描述

2. Model bias

就是你模型太简单了
在这里插入图片描述

3. Optimization

在训练集上效果就不好,除了是本身模型有一定的偏差,如太过简单等,还有可能是优化问题 ,比如学习率、梯度下降的方法、起始点的选择等
在这里插入图片描述

4. 怎么判断是Model bias还是Opimization导致的?

首先要明确,不是所有的测试数据集上的结果不好都是过拟合导致的,我们还需要看训练集上的结果,很多人的误区就是只看测试集的结果,忽略测试集的结果,将不好的结果简单归因于过拟合。
在这里插入图片描述
判断的方法如下图所示:

  • 先从浅层网络开始生成结果
  • 如果更深层的网络在训练集上没有表现得更好,那么就是优化问题

在这里插入图片描述

5. Overfitting

先看训练集上的结果(损失小),再看测试集上的结果(损失大),正式确诊为Overfitting
在这里插入图片描述

6. Mismatch

就是说训练集和测试集的数据大不相同,懂了吧
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

香菜菜菜菜子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值