【AI概念】过拟合(Overfitting)vs 欠拟合(Underfitting)详解 | 他们有什么区别?|定义、数学表达、几何直观、典型案例、成因、检测方法以及工程应对策略|偏差方差权衡、正则化

大家好,我是爱酱。本篇将会系统讲解机器学习中最常见、最容易混淆的两个概念:过拟合(Overfitting)欠拟合(Underfitting)。内容包括定义、数学表达、几何直观、典型案例、成因、检测方法以及工程应对策略。每部分都会详细展开,适合初学者和进阶者系统理解。

注:本文章含大量数学算式、详细例子说明及大量代码演示,大量干货,建议先收藏再慢慢观看理解。新频道发展不易,你们的每个赞、收藏跟转发都是我继续分享的动力!


一、什么是过拟合与欠拟合?

1. 过拟合(Overfitting)

  • 定义:模型在训练集上表现极好,但在新数据(测试集)上表现很差。即模型“记住了”训练集的噪声和细节,却没有学到数据的本质规律。
    像现实你在考试前背书,的确背好了,能够应付这次考试,但其实对其他考试一窍不通。因为没有了解到背的内容,因此面对其他试题的时候无法融会贯通。

  • 常见现象:训练误差极低,测试误差很高。

2. 欠拟合(Underfitting)

  • 定义:模型在训练集和测试集上都表现不好,无法捕捉数据的主要趋势或规律。即模型“太简单”,无法拟合数据的真实分布。

  • 常见现象:训练误差和测试误差都很高。


二、数学表达与几何直观

1. 损失函数与泛化误差

  • 假设$L_{train}$为训练集损失,$L_{test}$为测试集损失。

    • 过拟合$L_{train} \ll L_{test}$

    • 欠拟合$L_{train}$$L_{test}$都很高

  • 数学公式:

    \text{Training Error} = \frac{1}{n_{train}} \sum_{i=1}^{n_{train}} \ell(\hat{y}_i, y_i)

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值