validation

文章探讨了模型选择的策略,包括使用Ein、Etest和validation data。提出了将数据分为训练集和验证集来平衡模型复杂度和泛化能力。讨论了validation size的重要性,并介绍了leave-one-out cross validation和v-fold cross validation的优缺点。最后强调了计算量和稳定性的问题,并指出在找到最优模型后,通常使用所有数据重新训练以获得最佳模型参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

如何来确定最优的模型?
使用Ein(w):以最小的Ein(w)作为标准,将导致模型复杂度过高,往往泛化能力不足!
在这里插入图片描述
使用Etest(w):但是无法收集测试数据!
在这里插入图片描述
折中的方案就是从用于演算法的数据割裂一部分出来,以pick 最优的模型!
在这里插入图片描述
如果没有validation data,我们将所有收集的数据喂到M个演算法(model)中根据error function 学到最优参数,同样使用这组数据计算出m个模型的Ein(gm),最终pick最好的model!一旦使用了validation data,将所有数据分为用于演算法的training data和用于pick最终model的validation data!使用validation data 来pick model可以得到以下保证,此时Eout和Eval由于复杂度不大是接近的
在这里插入图片描述注意!使用越多的数据来进行训练所得到的Eout(h)也会越小!我们保留了部分的数据作为validation data ,在我们选出了最好的模型后,可以利用所有的数据重新得到关于这个模型新的参数,此

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值