偏差与方差(bias and variance)
在回归问题中,我们用一个简单的线性模型来拟合样本,称为线性回归,如图1;或者用更复杂,高维的函数来拟合,比如二次函数得到图2,六次函数得到图3.

我们可以看出来, 六次函数完美地拟合了六个点,误差为0.但是,当我们用这样的拟合模型来进行预测的时候,效果反而不好.
通过观察我们发现,二次的模型也许能够更好地拟合这些样本分布.
虽然1,3图都不能很好地拟合真实分布,但是他们的问题是很不一样的.
我们暂且称图1的问题为偏差(bias),图3的问题为方差(variance).
一般误差与经验误差
我们来定义如下几个概念: