Holdout检验:
Holdot检验是最简单也是最直接的验证方法,它将原始的样本集合随机划分成训练集和验证集2部分。
比方说,对于一个点击率预测模型,我们把样本按照70%-30%的比例分成2部分,70%的样本用于模型训练。30%用于模型验证,包括绘制ROC曲线,计算精确率和召回率等指标来评估模型性能。
holdout检验的缺点很明显:
即在验证集上计算出来的最后评估指标和原始分组有很大的关系。为了消除这个随机性,研究者引入了“交叉检验”.
交叉检验:
k-fold交叉验证:
首先将全部样本划分成K个大小相等的样本子集。依次遍历这K个子集, 每次 每次把当前子集作为验证集,其余所有子集作为训练集,进行模型训练和评估。最后把k次的评估指标的平均值作为最终的评估指标。在实际实验中,K经常取值10.
留一验证:
每次留下一个样本作为验证集,其余所以样本作为测试集。样本总数为N,一次对N个样本进行遍历,进行N次验证&