机器学习（十五） - Bias vs. Variance

理解机器学习：偏差与方差的诊断

最新推荐文章于 2025-10-12 15:00:00 发布

原创

最新推荐文章于 2025-10-12 15:00:00 发布 · 4.9k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #过拟合 #欠拟合 #学习曲线

本文探讨了机器学习中偏差与方差的概念，通过图表解释了欠拟合和过拟合的表现。介绍了正则化在处理过拟合中的作用以及选择合适正则化系数的方法。学习曲线作为一种有效的诊断工具，帮助区分高偏差和高方差问题。针对不同问题，提出了相应的解决方案，如增加训练数据、减少特征或调整正则化参数。

Diagnosing Bias vs. Variance

讲完模型选择，我们接下来讲讲如何去诊断我们算法出现的问题到底是一个high bias（underfitting）的问题还是一个high variance（overfitting）的问题又或者同时两个问题同时存在，因为几乎所有的导致test error不理想的原因都来自于这三种情况中的一种。
我们还是从我们最熟悉的一张图引入（线性拟合）：
这里写图片描述
左图欠拟合，右图过拟合，中间刚刚好。
那么现在我们换一张图来看看这三种情况的呈现形式

其实线性回归中，次方代表的就是参数个数，次方低表示参数少，次方高代表参数多。那么上图就是参数个数-error曲线图。

欠拟合
$Jtrain(Θ)≈Jcv(Θ)J_{train}(\Theta)\approx J_{cv}(\Theta)$ ，并且它们都很大，即验证集和训练集的error都很高（这里cv代表的是验证集）
过拟合
$Jtrain(Θ)J_{train}(\Theta)$ 很小，同时 $Jcv(Θ)J_{cv}(\Theta)$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。