机器学习西瓜书—第二章 模型评估与选择(学习笔记 1)

本文介绍了机器学习中的过拟合和欠拟合现象,以及如何评估模型的泛化能力。讨论了留出法、交叉验证法、自助法等训练集和测试集的划分方法,用于模型选择和参数调参。强调了测试集与训练集的互斥性对评估结果的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2.1 经验误差与过拟合

分类错误的样本数占样本总数的比例称为错误率(error rate),即如果在m个样本中有a个样本分类错误,则错误率E=a/m;

1 - a/m称为精度(accuracy),即精度=1-错误率

学习器的实际预测输出与样本的真实输出之间的差异称为误差(error)

学习器在训练集上的误差称为训练误差(training error)经验误差(empirical error)。在新样本上的误差称为 泛化误差(generalization error)

当学习器把训练样本学得太好,即很有可能将训练样本自身的一些特点当做了潜在样本会具有的一般性质,这样就会导致泛化性能下降,这种现象在机器学习中称为过拟合(overfitting)。当学习器对训练样本的一般性质都未学好时,称为欠拟合(underfitting)

过拟合是机器学习面临的关键障碍,对于各类学习算法来说,过拟合是无法彻底避免的,只能缓解。

 

2.2 评估方法

模型选择问题:选用哪个学习算法?选用哪种参数配置?

通过实验测试来对学习器的泛化误差进行评估进而选择模型。为此,需要一个测试集(testing set)来测试学习器对新样本的判别能力,然后以测试集上的测试误差(testing error)作为泛化误差的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值