吃瓜教程task01 第2章 模型评估与选择

本文介绍了模型评估的关键概念,包括经验误差、泛化误差、过拟合和欠拟合。探讨了不同的评估方法,如留出法、交叉验证法和自助法,并强调了参数调参的重要性。此外,还讨论了错误率、精度、查准率、查全率以及F1度量在性能评估中的作用,特别是它们在平衡查准率和查全率中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第二章 模型评估与选择

2022/5/15 雾切凉宫 至2.3.3节

2.1 经验误差与过拟合

中文名 英文名 意义
训练误差/经验误差 training error/empirical error 学习器在训练集的误差
泛化误差 generalization error 在新样本上的误差
过拟合 overfitting 学习能力过于强大
欠拟合 underfitting 学习能力低下

2.2 评估方法

通过实验测试来对学习器的泛化误差进行评估

2.2.1 留出法

留出法(hold-out)直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即D= SUT, S∩T=0.在S上训
练出模型后,用T来评估其测试误差,作为对泛化误差的估计。

2.2.2 交叉验证法

“交叉验证法”(cross validation)先将数据集D划分为k个大小相似的互斥子集。每个子集Di都尽可能保持数据分布的一致性,即从D中通过分层采样得到。然后,每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集;这样就可获得k组训练/测试集,从而可进行k次训练和测试,通常把交叉验证法称为“k折交叉验证”(k-fold cross validation)。k最常用的取值是10,此

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值