李宏毅ML-02-Where does the error come from? 误差分析

最新推荐文章于 2020-08-09 21:59:51 发布

MOFD0

最新推荐文章于 2020-08-09 21:59:51 发布

阅读量243

点赞数

CC 4.0 BY-SA版权

分类专栏： machine learning

本文链接：https://blog.youkuaiyun.com/weixin_43238442/article/details/90138534

3 篇文章

订阅专栏

本文深入探讨了机器学习中常见的误差类型，bias和variance，以及它们与模型复杂度的关系。通过理解欠拟合和过拟合的概念，文章提供了减少误差的策略，如增加数据量、正则化和特征工程。此外，还介绍了交叉验证技术，以提高模型评估的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一般的，我们把误差分为两类：

$b i a s$
模型越复杂 $b i a s$ 一般越小，在training set上表现越好, 拟合效果越好；同时受到training data的影响越大以至于最后overfitting；
$v a r i a n c e$
模型越简单平滑，波动越小， $v a r i a n c e$ 越小；但是模型过于简单，预测结果虽然不离散但是 $b i a s$ 较大- $u n d e r f i t t i n g$

所以要在两种 $e r r o r$ 中找到平衡。

如果model能在training data上有不好的结果，取得了较大的 $e r r o r$ ，model可能具有较大的 $b i a s$ ；我们称之为欠拟合，under fitting。
如果模型在training set 上取地了较好的结果但是在test set上误差很大，model可能具有较大的 $v a r i a n c e$ ，我们称之为过拟合，over fitting。

Large Variance
使用更多的数据：更多的数据是最要好的方法，足够的数据可以提供足够的信息；试想如果我们的training set包括了所有可能的数据那么训练出的模型就是适用于所有test set的。
正则化Regularization：前面的笔记中已经提到了，正则化可以帮助我们的到比较平滑的曲线，减小曲线的震荡程度；
Large Bias
使用更多的 feature 作为input；
重新设计更复杂的model；