这里假设所用的分类器是最优分类器,而且训练集、验证集、测试集均属于同一分布。
偏差与方差主要与两个因素有关:
训练集误差(train set error)、验证集误差(dev set error)
train set error | 1%(很小) | 15%(较大) | 15% | 0.5% |
dev set error | 11%(较大) | 16%(较大,但相较于train set error是合理的) | 30%(过大) | 1% |
方差、偏差 | 高方差(数据过拟合) | 高偏差(数据欠拟合) | 高方差、高偏差 | 低方差、低偏差 |
具体分析如下