从0开始学习机器学习--Day19--学习曲线

最新推荐文章于 2024-12-01 12:17:16 发布

原创

最新推荐文章于 2024-12-01 12:17:16 发布 · 2.4k 阅读

·

37

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#学习 #机器学习 #人工智能

一般来说，如果一个算法的表现不理想，那么多半是因为出现了欠拟合或过拟合问题，这种时候我们要做的就是搞清楚出现的是偏差问题还是方差问题，亦或是二者皆有，这有助于我们精准定位问题所在。

之前，我们发现假设函数多项式的次数越高，代价函数的误差就越小，假设我们把多项式的次数作为横坐标，训练集代价函数的误差为纵坐标画图，呈现出来的应该是随着横坐标增大纵坐标不断减小的图像：

随着多项式次数增加两种代价函数的变化情况

但如果换做是验证集的假设函数，图像又有所不同。可以看到在 $d=2$ 的时候，其误差确实小了，这反映的是其预测值和实际值之间的误差变小，但当 $d=4$ 时，出现了过拟合的情况，此时预测值与实际值之间的差又变大，所以其曲线又往上升而不是继续下降，这进一步地说明了为什么我们采用验证集的参数而不是直接用训练集的。

也就是说，通过比较训练集和验证集代价函数的误差，可以确定到底是出现了什么问题。假如两者都很大且两者差值较小，则说明式出现了高偏差、欠拟合的情况，应该适当增大多项式的次数；如果训练集的误差远远小于验证集的误差，则说明出现了高方差、过拟合的情况，需要适当减小多项式的次数。

正则化和偏差、方差(Regularization and bias/variance)

在之前学习正则化的时候，我们知道通过正则化参数，可以挑选出不太重要的参数项，从而决定多项式的次数。但之前我们基本默认

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。