12. 机器学习 - 拟合

本文讨论了机器学习中的拟合、过拟合和欠拟合概念,强调了异常值对模型的影响,介绍了BIAS和VARIANCE的概念,以及如何通过训练数据比例、模型复杂度和特征缩放来解决这些问题。还提到了训练集、验证集和测试集的重要性,以及交叉验证在数据利用上的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

茶桁的AI秘籍  核心基础 12

Hi, 你好. 我是茶桁.

这一节课一开始我们要说一个非常重要的概念: 拟合.

拟合

相信只要你关注机器学习, 那么多少在某些场合下都会听到拟合这个概念.

什么叫做拟合,什么叫做过拟合或者欠拟合呢?

Alt text

假如有一个模型, 这个模型在训练数据的时候效果很好, 体现在loss很小, 或者说precision很高, accuracy也比较好, 但是在实际情况下, 用到没有见过的数据的时候,效果就很差, 那么这个就过拟合了.

在这个过程中,要主一的是仅当数据label比较均衡的时候, 才有必要使用acc.

我们来看三条曲线:

Alt text

第一个图是比较合理的参数模型, 第二个图就是过拟合的参数模型.

因为对数据过度拟合, 当有新的点出现的时候, 函数的趋势和新的点并不匹配. 那过度拟合就会对于未来的点就预测不对了. 为了在训练的时候效果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

茶桁

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值