机器学习的误差从何而来？“偏差-方差分解 ” |李宏毅机器学习【3】

最新推荐文章于 2025-06-03 13:08:59 发布

红尘一笑233

最新推荐文章于 2025-06-03 13:08:59 发布

阅读量1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Machine Learning 文章标签：机器学习偏差方差过拟合欠拟合

本文链接：https://blog.youkuaiyun.com/qq_36459893/article/details/82291687

本文探讨了机器学习中偏差-方差分解的概念，解释了偏差（预期预测与真实结果的偏离）和方差（数据扰动引起的学习性能变化）如何影响模型的泛化性能。简单模型通常偏差大、方差小，而复杂模型则反之。过拟合和欠拟合分别对应于方差和偏差主导的情况。通过训练集和测试集的表现，可以判断模型是否处于欠拟合或过拟合状态，并据此调整模型复杂度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对于机器学习算法，可以通过实验估计其泛化性能，但是为什么不同算法在不同训练集上有不同的错误率？欠拟合和过拟合的深层原因到底是什么？“偏差-方差分解”(Bias-Variance decomposition)是解释算法泛化性能的一种常用工具。

顾名思义，偏差-方差分解就是试图把学习算法的期望泛化错误率分解为偏差和方差。偏差指的是期望预测和真实结果之间的偏离程度，而方差指的是因相同数量的训练集的变化而引起的学习性能的变化。

简单的模型拟合能力弱，预测的偏差大，同时受数据扰动小，方差也比较小；复杂的模型拟合能力强，偏差比较小，但是对数据扰动更加敏感，所以方差就比较大。

下面来看具体的例子：