训练误差:模型在训练数据上的误差
泛化误差:模型在新数据上的误差(*)
例:在过去的考试中表现很好(训练误差)不代表在未来考试一定会好(泛化误差)
验证数据集:一个用来评估模型好坏的数据集(和训练数据集不一样)
测试数据集:只用一次的数据集
K-折交叉验证:在没有足够多的数据时使用。(常用:K=5,10)
算法:将训练数据分割成K块;For i=1,...,K,使用第i块作为验证数据集,其余的作为训练数据集;报告K个验证集误差的平均


模型容量:模型复杂度


d+1:d个w和1个b
本文探讨了训练误差与泛化误差的区别,强调了模型在新数据上的表现才是真正衡量其性能的标准。通过验证数据集和测试数据集的概念,阐述了评估模型的重要手段。此外,介绍了K-折交叉验证作为数据有限时的解决方案,并解释了模型容量即模型复杂度对过拟合和欠拟合的影响。
训练误差:模型在训练数据上的误差
泛化误差:模型在新数据上的误差(*)
例:在过去的考试中表现很好(训练误差)不代表在未来考试一定会好(泛化误差)
验证数据集:一个用来评估模型好坏的数据集(和训练数据集不一样)
测试数据集:只用一次的数据集
K-折交叉验证:在没有足够多的数据时使用。(常用:K=5,10)
算法:将训练数据分割成K块;For i=1,...,K,使用第i块作为验证数据集,其余的作为训练数据集;报告K个验证集误差的平均


模型容量:模型复杂度


d+1:d个w和1个b
3352
3643
359
298
1032
1591
538

被折叠的 条评论
为什么被折叠?