目录
前言
以下仅为个人对作业的理解,仅供参考喔~
一、理解模型的学习能力,泛化能力?
学习能力:是指学习得到的模型关于训练样本集的预测能力
泛化能力:是指学习得到的模型关于未知样本的预测能力
二、理解什么是学习误差?什么是测试误差?
学习误差:指模型在训练集上的错分样本比率,即在训练集上训练完毕后在训练集本身上进行预测得到的错分率
测试误差:指模型在测试集上的错分样本比率,即学得模型后,在测试集上用模型预测错误的样本占所有样本的比率。用测试误差评价模型的泛化能力
三、理解什么是交叉验证?
交叉验证是一种将数据集合理划分成训练集和测试集的一种方法
交叉验证的过程:先将数据集D划分为k个大小相似的互斥子集,即D=D1∪D2∪…∪Dk,Di∩Dj=ø(i≠j),每个子集Di都尽可能保持数据分布的一致性,即从D中通过分层采样得到。然后,每次用k - 1个子集的并集作为训练集,余下的那个子集作为测试集,这样就可获得k组训练/测试集,从而可进行k次训练和测试,最终返回的是这k个测试结果的平均值。通常把交叉验证法称为“k折交叉验证”,k最常用的取值是10