模型选择+过拟合和欠拟合

最新推荐文章于 2025-11-24 11:43:51 发布

原创最新推荐文章于 2025-11-24 11:43:51 发布 · 343 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能 #算法

李沐动手学深度学习专栏收录该内容

9 篇文章

订阅专栏

文章关注于模型的训练误差和泛化误差，强调泛化误差的重要性。介绍了验证数据集和测试数据集的作用，以及k-折交叉验证的方法来处理数据不足的情况。讨论了过拟合和欠拟合问题，指出模型容量应适配数据复杂度。此外，提到VC维作为理论上的模型复杂度指标，在深度学习中并不常用。

训练误差和泛化误差

训练误差：模型在训练数据上的误差
泛化误差：模型在新数据上的误差
我们更关心的是泛化误差，而不是训练误差。

验证数据集和测试数据集

验证数据集：一个用来评估模型好坏的数据集
测试数据集：只用一次的数据集

k-折交叉验证

在没有足够多数据时使用（这是常态）
算法：
（1）将训练数据分割成k块
（2）for i =1,…,k：
使用第i块作为验证数据集，其余的作为训练集
（3）报告k个验证机误差的平均
常用： k=5或10

过拟合和欠拟合

模型容量\数据	简单数据	复杂数据
低（简单模型）	正常	欠拟合
高（复杂模型）	过拟合	正常

模型容量

（1）拟合各种函数的能力；
（2）低容量的模型难以拟合训练数据；
（3）高容量的模型可以记住所有的训练数据。
在这里插入图片描述

估计模型容量

（1）难以在不同的种类算法之间比较
（2）给定一个模型种类，将有两个主要因素
参数的个数、参数值的选择范围

VC维（很少用）

统计学习理论的一个核心思想
对于一个分类模型，VC等于一个最大的数据集的大小，不管如何给定标号，都存在一个模型来对他进行完美分类
VC维的用处
其提供为什么一个模型好的理论依据，可以衡量训练误差和泛化误差之间的间隔。但在深度学习中很少使用，因为其衡量不是很准确，且计算深度模型的VC维很困难。