机器学习实践（十三）—sklearn之欠拟合与过拟合

最新推荐文章于 2025-02-16 08:33:15 发布

泡泡码客

最新推荐文章于 2025-02-16 08:33:15 发布

阅读量1k

点赞数 2

CC 4.0 BY-SA版权

分类专栏：机器学习实践文章标签：机器学习 sklearn 过拟合欠拟合

本文链接：https://blog.youkuaiyun.com/qq_28827635/article/details/84481430

18 篇文章

订阅专栏

博客介绍了机器学习中的过拟合与欠拟合现象。欠拟合是模型过于简单，在训练和测试集都拟合不佳；过拟合是模型复杂，训练集拟合好但测试集偏差大。分析了两者产生的原因及解决办法，还阐述了正则化的概念、类别（L1和L2）及原理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

当训练数据训练的很好误差也不大的时候，为什么在测试集上面进行预测会有较大偏差呢？

当算法在某个数据集当中出现这种情况，可能就出现了过拟合现象。

什么是正则化

在学习的时候，数据提供的特征有些影响模型复杂度或者这个特征的数据点异常较多，所以算法在学习的时候尽量减少这个特征的影响（甚至删除某个特征的影响），这就是正则化

注：调整时候，算法并不知道某个特征影响，而是去调整参数得出优化的结果
正则化类别
- L2 正则化
  - 作用：可以使得其中一些W的都很小，都接近于 0，削弱某个特征的影响
  - 优点：越小的参数说明模型越简单，越简单的模型则越不容易产生过拟合现象
  - Ridge回归(岭回归)
- L1 正则化
  - 作用：可以使得其中一些W的值直接为 0，删除这个特征的影响
  - LASSO回归(稀疏)
原理
- 线性回归的损失函数用最小二乘法，等价于当预测值与真实值的误差满足正态分布时的极大似然估计；
- 岭回归的损失函数，是最小二乘法+L2范数，等价于当预测值与真实值的误差满足正态分布，且权重值也满足正态分布（先验分布）时的最大后验估计；
- LASSO的损失函数，是最小二乘法+L1范数，等价于当预测值与真实值的误差满足正态分布，且权重值满足拉普拉斯分布（先验分布）时的最大后验估计