大家好,我是爱酱。本篇将会系统讲解机器学习中最常见、最容易混淆的两个概念:过拟合(Overfitting)与欠拟合(Underfitting)。内容包括定义、数学表达、几何直观、典型案例、成因、检测方法以及工程应对策略。每部分都会详细展开,适合初学者和进阶者系统理解。
注:本文章含大量数学算式、详细例子说明及大量代码演示,大量干货,建议先收藏再慢慢观看理解。新频道发展不易,你们的每个赞、收藏跟转发都是我继续分享的动力!
一、什么是过拟合与欠拟合?
1. 过拟合(Overfitting)
-
定义:模型在训练集上表现极好,但在新数据(测试集)上表现很差。即模型“记住了”训练集的噪声和细节,却没有学到数据的本质规律。
像现实你在考试前背书,的确背好了,能够应付这次考试,但其实对其他考试一窍不通。因为没有了解到背的内容,因此面对其他试题的时候无法融会贯通。 -
常见现象:训练误差极低,测试误差很高。
2. 欠拟合(Underfitting)
-
定义:模型在训练集和测试集上都表现不好,无法捕捉数据的主要趋势或规律。即模型“太简单”,无法拟合数据的真实分布。
-
常见现象:训练误差和测试误差都很高。
二、数学表达与几何直观
1. 损失函数与泛化误差
-
假设
为训练集损失,
为测试集损失。
-
过拟合:
-
欠拟合:
和
都很高
-
-
数学公式:

最低0.47元/天 解锁文章
80

被折叠的 条评论
为什么被折叠?



