如何来确定最优的模型?
使用Ein(w):以最小的Ein(w)作为标准,将导致模型复杂度过高,往往泛化能力不足!
使用Etest(w):但是无法收集测试数据!
折中的方案就是从用于演算法的数据割裂一部分出来,以pick 最优的模型!
如果没有validation data,我们将所有收集的数据喂到M个演算法(model)中根据error function 学到最优参数,同样使用这组数据计算出m个模型的Ein(gm),最终pick最好的model!一旦使用了validation data,将所有数据分为用于演算法的training data和用于pick最终model的validation data!使用validation data 来pick model可以得到以下保证,此时Eout和Eval由于复杂度不大是接近的
注意!使用越多的数据来进行训练所得到的Eout(h)也会越小!我们保留了部分的数据作为validation data ,在我们选出了最好的模型后,可以利用所有的数据重新得到关于这个模型新的参数,此
validation
最新推荐文章于 2025-06-06 17:34:13 发布