R语言 模型评估与选择

模型评估:先算测试集误差接着用统计检验方法检验误差(泛化能力)到底成不成立。


1、 经验误差

如果在m个样本中有a个样本分类错误,则错误率为E=a/m,对应地精确度为1-a/m。实际预测输出与样本的真实值之间的差异成为“误差”。学习器在训练集在的误差成为“经验误差”。在新样本上的误差称为“泛化误差”。显然,泛化误差小的学习器是我们希望得到的。


2、 评估方法

测试集是用来测试学习器对新样本的判别能力,然后以测试集上的“测试误差”作为泛化误差的近似。


2.1 训练样本和测试样本划分

1)  留出法:直接将数据集D划分为两个互斥的集合,其中一个作为训练集S,另外一个作为测试集T。在S训练出模型之后,用T来评估其测试误差,作为对泛化误差的估计。

2)  交叉验证法(k折交叉验证法):将数据集D划分为k个大小相似的互斥子集,每个自己Di都尽可能保持一致,然后每次用k-1个子集的并集作为训练集,余下的那个子集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值