Tensorflow-泛化能力（8）

最新推荐文章于 2025-07-08 20:01:18 发布

原创

最新推荐文章于 2025-07-08 20:01:18 发布 · 717 阅读

1 ·

CC 4.0 BY-SA版权

本文介绍了机器学习中的泛化能力，包括过拟合和欠拟合的概念。过拟合指模型在训练集上表现优秀但在测试集上表现不佳，而欠拟合则相反。文章强调了机器学习的三个基本假设，并指出违反这些假设可能导致问题。最后，提出了通过训练集和测试集分离来评估模型泛化性能的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

泛化能力

泛化能力的概念
过拟合和欠拟合的概念
机器学习细则
总结

泛化能力的概念

泛化能力是指学习到的模型对未知数据的预测能力；我们通常通过测试误差来评价学习方法的泛化能力。

过拟合和欠拟合的概念

所谓过拟合（over-fitting）其实就是所建的机器学习模型或者是深度学习模型在训练样本中表现得过于优越，导致在验证数据集以及测试数据集中表现不佳。打个比喻就是当我需要建立好一个模型之后，比如是识别一只狗狗的模型，我需要对这个模型进行训练。恰好，我训练样本中的所有训练图片都是二哈，那么经过多次迭代训练之后，模型训练好了，并且在训练集中表现得很好。基本上二哈身上的所有特点都涵括进去，那么问题来了！假如我的测试样本是一只金毛呢？将一只金毛的测试样本放进这个识别狗狗的模型中，很有可能模型最后输出的结果就是金毛不是一条狗（因为这个模型基本上是按照二哈的特征去打造的）。所以这样就造成了模型过拟合，虽然在训练集上表现得很好，但是在测试集中表现得恰好相反，在性能的角度上讲就是协方差过大（variance> is large），同样在测试集上的损失函数（cost function）会表现得很大。
所谓欠拟合呢（under-fitting）？相对过拟合欠拟合还是比较容易理解。还是拿刚才的模型来说，可能二哈被提取的特征比较少，导致训练出来的模型不能很好地匹配，表现得很差，甚至二哈都无法识别。

机器学习细则

以下三项基本假设阐明了泛化：

我们从分布中随机抽取独立同分布 (i.i.d) 的样本。换言之，样本之间不会互相影响。（另一种解释：i.i.d. 是表示变量随机性的一种方式）。

分布是平稳的；即分布在数据集内不会发生变化。

我们从同一分布的数据划分中抽取样本。

在实践中，我们有时会违背这些假设。例如：

想象有一个选择要展示的