一、基本思想
把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validation set),首先用训练集对分类器进行训练,在利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标.
二、主要方法
1. 留出法 (holdout cross validation)
2. k 折交叉验证(k-fold cross validation)记为K-CV
在{A2,A3,A4,A5,A6,A7,A8,A9,A10}基础上构建模型M1,并对数据集A1进行验证,将预测值与真值进行比较,在某一评价标准下,计算一个得分a1,1
.
在{A1,A3,A4,A5,A6,A7,A8,A9,A10}
基础上构建模型M1,并对数据集A2进行验证,将预测值与真值进行比较,在同一评价标准下,计算一个得分a1,2
.
……
在{A1,A2,A3,A4,A5,A6,A7,A8,A9}
基础上构建模型,并对数据集A10进行验证,将预测值与真值进行比较,在同一评价标准下,计算一个得分a1,10
.
a1=a1,1+a1,2+…+a1,10/10
作为模型M1的综合得分。
k 折交叉验证通过对 k 个不同

交叉验证是一种评估机器学习模型性能的方法,包括留出法、k折交叉验证和留一法。通过将数据集分为训练集和验证集,训练模型并在验证集上评估,以降低模型对数据划分的敏感性,防止过拟合或欠拟合。k折交叉验证通常选择k=10,而留一法中每个样本都作为验证集进行一次验证。
最低0.47元/天 解锁文章
1178

被折叠的 条评论
为什么被折叠?



