机器学习中偏差和方差的区别

最新推荐文章于 2025-06-03 13:08:59 发布

转载最新推荐文章于 2025-06-03 13:08:59 发布 · 568 阅读

面试常见问题专栏收录该内容

37 篇文章

订阅专栏

本文深入探讨了L1和L2正则化的本质区别，即拉普拉斯与高斯先验，以及它们如何影响模型的稳定性。通过分析偏差与方差的概念，解释了参数变化对模型稳定性的影响，尤其是在不同λ值下的表现。最后，讨论了如何在XGBoost中通过增加树的数量和深度来减少偏差，同时利用交叉验证和正则化减少方差，以达到最佳的泛化效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

今天在看L1和L2正则的相关知识时，看到这样一段话：

L2与L1的区别在于，L1正则是拉普拉斯先验，而L2正则则是高斯先验。它们都是服从均值为0，协方差为1λ。当λ=0时，即没有先验）没有正则项，则相当于先验分布具有无穷大的协方差，那么这个先验约束则会非常弱，模型为了拟合所有的训练集数据，参数w可以变得任意大从而使得模型不稳定，即方差大而偏差小。λ越大，标明先验分布协方差越小，偏差越大，模型越稳定。即，加入正则项是在偏差bias与方差variance之间做平衡tradeoff。

让我很困惑的是为什么参数w任意大时模型不稳定会出现方差大偏差小的情况，那么方差和偏差作为两种度量方式有什么区别呢？

首先看了下百度百科中偏差的解释为：偏差又称为表观误差，是指个别测定值与测定的平均值之差。感觉这个解释并不太应用于机器学习中，那么这句话在机器学习中的意思应该是预测值与真实值之间的距离。

在知乎上看到了几种解释，还是比较有助于自己理解的：

1、偏差：描述的是预测值（估计值）的期望与真实值之间的差距。偏差越大，越偏离真实数据，如下图第二行所示。

方差：描述的是预测值的变化范围，离散程度，也就是离其期望值的距离。方差越大，数据的分布越分散，如下图右列所示。