概念
之前,我们介绍过拟合的概念。拟合指的是构建的模型能够符合样本数据的特征。与拟合相关的两个概念是欠拟合与过拟合。
- 欠拟合:模型过于简单,未能充分捕获样本数据的特征。表现为模型在训练集上的效果不好。
- 过拟合:模型过于复杂,过分捕获样本数据的特征,从而将样本数据中一些特殊特征当成了共性特征。表现为模型在训练集上的效果非常好,但是在未知数据上的表现效果不好。

解决方案
如果产生欠拟合,可以采用如下方式,来达到更好的拟合效果。
- 增加迭代次数
- 增加模型复杂度(例如,引入新的特征)
- 通过多项式扩展
- 使用更复杂的模型(例如非线性模型)
如果产生过拟合