在模型评估过程中，有哪些主要的验证方法，他们的优缺点是什么？在自助法的采样过程中，对Ｎ个样本进行Ｎ次自助采样，当Ｎ区域无穷大时最终有多少个数据从未被选择过？

最新推荐文章于 2025-04-06 16:46:38 发布

光英的记忆

最新推荐文章于 2025-04-06 16:46:38 发布

阅读量4.2k

点赞数 2

分类专栏：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_29678299/article/details/88760720

版权

本文介绍了模型评估的几种主要方法，包括Holdout检验、交叉验证（如k-折交叉验证）和自助法。Holdout检验易受随机性影响，而交叉验证通过多次划分减少这种影响。留一验证在样本数量大时计算成本高。自助法通过有放回抽样保持训练集大小，约36.8%的样本在无穷大样本量时不会被选中，适合作为验证集。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Ｈｏｌｄｏｕｔ检验：

Ｈｏｌｄｏｔ检验是最简单也是最直接的验证方法，它将原始的样本集合随机划分成训练集和验证集２部分。

比方说，对于一个点击率预测模型，我们把样本按照７０％－３０％的比例分成２部分，７０％的样本用于模型训练。３０％用于模型验证，包括绘制ＲＯＣ曲线，计算精确率和召回率等指标来评估模型性能。

ｈｏｌｄｏｕｔ检验的缺点很明显：

即在验证集上计算出来的最后评估指标和原始分组有很大的关系。为了消除这个随机性，研究者引入了“交叉检验”．

交叉检验：

ｋ－ｆｏｌｄ交叉验证：

首先将全部样本划分成Ｋ个大小相等的样本子集。依次遍历这Ｋ个子集，　每次　　每次把当前子集作为验证集，其余所有子集作为训练集，进行模型训练和评估。最后把ｋ次的评估指标的平均值作为最终的评估指标。在实际实验中，Ｋ经常取值１０.

留一验证：

每次留下一个样本作为验证集，其余所以样本作为测试集。样本总数为N，一次对Ｎ个样本进行遍历，进行Ｎ次验证&

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。