什么是偏差和方差?
在机器学习中,偏差(Bias) 和 方差(Variance) 是两个用来描述模型性能的重要概念,它们帮助我们理解模型在训练数据和测试数据上的表现差异,以及如何提升模型的泛化能力。
偏差(Bias)
- 定义:偏差是指模型预测值与真实值之间的平均差异。简单来说,它衡量模型是否能够准确拟合训练数据。
- 特点:
- 如果偏差高,说明模型过于简单,无法捕捉数据中的复杂模式,这种情况称为欠拟合(Underfitting)。
- 欠拟合的模型在训练集和测试集上表现都不佳。
- 举例:用一个线性回归模型去拟合一个明显的非线性关系数据集,会因为模型过于简单而产生高偏差。
方差(Variance)
- 定义:方差衡量模型预测的稳定性和变异性&#x