第二章 模型评估与选择
2022/5/15 雾切凉宫 至2.3.3节
2.1 经验误差与过拟合
中文名 | 英文名 | 意义 |
---|---|---|
训练误差/经验误差 | training error/empirical error | 学习器在训练集的误差 |
泛化误差 | generalization error | 在新样本上的误差 |
过拟合 | overfitting | 学习能力过于强大 |
欠拟合 | underfitting | 学习能力低下 |
2.2 评估方法
通过实验测试来对学习器的泛化误差进行评估
2.2.1 留出法
留出法(hold-out)直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即D= SUT, S∩T=0.在S上训
练出模型后,用T来评估其测试误差,作为对泛化误差的估计。
2.2.2 交叉验证法
“交叉验证法”(cross validation)先将数据集D划分为k个大小相似的互斥子集。每个子集Di都尽可能保持数据分布的一致性,即从D中通过分层采样得到。然后,每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集;这样就可获得k组训练/测试集,从而可进行k次训练和测试,通常把交叉验证法称为“k折交叉验证”(k-fold cross validation)。k最常用的取值是10,此