周志华《机器学习》第二章模型评估与选择——模型评估方法

最新推荐文章于 2024-02-29 11:32:18 发布

原创最新推荐文章于 2024-02-29 11:32:18 发布 · 416 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #机器学习 #深度学习

西瓜书笔记专栏收录该内容

4 篇文章

订阅专栏

本文深入探讨了机器学习模型评估的重要方法，包括留出法、交叉验证法和自助法，详细解析了每种方法的操作流程及注意事项，帮助读者理解如何有效评估模型的泛化能力。

周志华《机器学习》（西瓜书）目录

https://editor.youkuaiyun.com/md?articleId=106864771
————————————————————————

模型评估方法

通常，我们可通过实验测试来对学习器的泛化误差进行评估并进而做出选择。

留出法
交叉验证法
自助法
调参与最终模型

留出法

“留出法” (hold-out)直接将数据集 D 划分为两个互斥的集合，其中一个集合作为训练集 S，另一个作为测试集 T，即 D=SUT， S $\cap$ T= $\varnothing$ .在 S 上训练出模型后，用 T 来评估其测试误差，作为对泛化误差的估计。
eg:
以二分类任务为例，假定 D包含 1000 个样本，将其划分为 8 包含 700 个样本， T 包含 300 个样本，用 S 进行训练后，如果模型在 T 上有 90 个样本分类错误，那么其错误率为 (90/300) x 100% 口 30%，相应的，精度为 1- 30% = 70%.
注意：

训练/测试集的划分要尽可能保持数据分布的一致性，避免困数据划分过程引入额外的偏差而对最终结果产生影响
在给定训练/测试集的样本比例后，仍存在多种划分方式对初始数据集D 进行分割。
选择合适的数据分割比例。

交叉验证法

“交叉验证法” (cross validation)先将数据集D划分为 k 个大小相似的互斥子集，即 D = D1 $\cup$ D2 $\cup$ … $\cup$ Dk, Di $\cap$ Dj = $\varnothing$ (í $\ne$ j ) . 每个子集 Di 都尽可能保持数据分布的一致性，即从 D 中通过分层采样得到。然后，每次用 k-1 个子集的并集作为训练集，余下的那个子集作为测试集;这样就可获得 k 组训练/测试集，从而可进行 k 次训练和测试, 最终返回的是这 k 个测试结果的均值。如下图所示，
10 折交又验证示意图

自助法

自助法：给定包含m 个样本的数据集 D ，我们对它进行采样产生数据集 D’: 每次随机从 D 中挑选一个样本，将其拷贝放入 D’，然后再将该样本放回初始数据集 D 中，使得该样本在下次采样时仍有可能被采到;这个过程重复执行m 次后，我们就得到了包含 m 个样本的数据集 D’，这就是自助采样的结果。
注意：