机器学习---经验误差与过拟合、方差与偏差、性能度量、比较检验

文章讨论了机器学习中的关键概念,包括模型的泛化能力、误差类型(如过拟合和欠拟合)、方差与偏差的分析,以及性能度量标准如均方误差、错误率、精度、F1分数和ROC曲线。此外,还介绍了如何通过假设检验来比较不同学习器的性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 经验误差与过拟合

第三张图建立的模型,在训练集中通过x可以很好的预测y,然而我们不能预期该模型能够很好的预

测集外的数据,换句话说,这个模型没有很好的泛化能力。

第一张图建立了一个线性模型,但是该模型并没有精确地捕捉到训练集数据的结构,我们称具有第

一张图较大的偏倚(bias),也称欠拟合。

第三张图通过5次多项式函数很好的对样本进行了拟合,然而,如果将建立的模型进行泛化,并不

能很好的对训练集之外的数据进行预测,也称过拟合。

机器学习的主要挑战在于在未见过的数据输入上表现良好,这个能力称为泛化能力

(generalization)。

误差:学习器实际预测输出与样本真实输出的差异。

训练集误差:训练误差

训练集的补集:泛化误差

测试集误差:测试误差

我们希望得到泛化误差小的学习器。

过拟合:训练过度使泛化能力下降。

欠拟合:未能学好训练样本的普遍规律。

过拟合是机器学习的关键障碍,且不可避免。

模型误差包含了数据误差,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

三月七꧁ ꧂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值