Ng笔记----诊断欠拟合与过拟合 (high bias or high variance)

本文介绍了如何诊断机器学习模型的欠拟合(高偏差)与过拟合(高方差)问题。通过观察训练集和测试集的误差,以及正则化参数λ的影响,可以确定模型的状态。使用验证集选择合适的λ值,并通过学习曲线分析模型性能。在高偏差情况下,增加样本数量效果不明显;而在高方差时,增加样本有助于降低误差。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.看图


可以看到,如果是处于high bias问题,那么training和test set的cost都会很大

如果是处于high variance问题,那么training set的cost很小,而test set的cost会很大


2. regularization与bias 以及variance的关系


可以看到,当我们将正则项的lambda设的很大时,惩罚项很重,曲线变得所有系数都趋于0,一条横线

而第三个是当lanbda很小的时候,这时候曲线就会过拟合。

一般的做法是使用validation来选择合适的lambda,然后作用在test set上。

我们看看lambda的值对training set与test set的cost的影响曲线:


lambda太小,则出现high variance问题,反之,则出现high bias 问题,只有正好处于中间某个值,才会fit well。


3.Learning Curve

画出Learning Curve有助于让你了解你当前的模型处于bias or variance阶段,便于你调整。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值