[机器学习-3]过拟合(Overfit)

本文探讨了过拟合的概念及其产生的原因,包括随机噪音与确定性噪音的影响,并讨论了高维度数据可能带来的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

What’s overfitting

The subjects performs an action which leads to a good
outcome and thereby generalizes it as cause and effect: the
action will always give good results. Having overfit the data, the
subject compulsively engages in that activity
通常会在噪音过多与参数过多或者维度过多(模型复杂)时发生
数值上的表现就是in-sample error 越来越小而out-of-sample error越来越大
在一些情况下简单的H甚至要优于复杂的H
在这里插入图片描述
给大家一个趋势
在这里插入图片描述

随机噪音(Stochastic Noise)

实际上我们测量的是两个量,一个是f还有一个就是噪音,我们想要测量f但是不可避免地测量了噪音,而噪音通常是波动与测量错误这些我们没办法建立模型的东西

确定性噪音(Deterministic Noise)

在这里插入图片描述
如果说随机噪音会使图像模糊,那么确定性噪音可能会导致我们测出一个很奇怪的东西
在这里插入图片描述
图像上
在这里插入图片描述

高维会带来的问题

在这里插入图片描述
在这里插入图片描述
高维以后数据的结构可能会被破坏掉,或者说复杂难以分明
在这里插入图片描述
可能会变成海胆一样
在这里插入图片描述
所以我们就需要正则化来克服这些问题,留到下章讲

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值