文章目录
经验误差与过拟合 (Empirical error &overfitting)
-
经验误差是指学习器 f f f 在训练集上表现出的误差。公式为:
R e m p ( f ) = 1 m ∑ i = 1 m L ( f ( x i ) , y i ) R_{emp}(f) = \frac{1}{m} \sum_{i=1}^{m} L(f(x_i), y_i) Remp(f)=m1i=1∑mL(f(xi),yi)
其中 L ( f ( x i ) , y i ) L(f(x_i), y_i) L(f(xi),yi) 是损失函数,表示模型在训练样本 ( x i , y i ) (x_i, y_i) (xi,yi) 上的误差。
-
泛化误差是指学习器 f f f 在未来的未见样本上所表现出的误差。公式为:
R ( f ) = E [ L ( f ( x ) , y ) ] = ∫ L ( f ( x ) , y ) d P ( x , y ) R(f) = \mathbb{E}[L(f(x), y)] = \int L(f(x), y) dP(x, y) R(f)=E[L(f(x),y)]=∫L(f(x),y)dP(x,y)
- 这里 P ( x , y ) P(x, y) P(x,y) 是样本的真实分布, L ( f ( x ) , y ) L(f(x), y) L(f(x),y) 表示模型对新的样本 ( x , y ) (x, y) (x,y) 的误差。
- 公式右侧的积分表达式说明了**泛化误差是模型在整个真实数据分布下的平均误差,**即模型不仅要在训练数据上表现好,还需要在未来可能遇到的未知样本上表现良好。
要点:
-
经验误差并非越小越好,因为过度减小经验误差可能导致模型过拟合(即模型在训练集上表现非常好,但在新样本上表现差)。
-
常见的损失函数与适用范围
1. 均方误差(Mean Squared Error, MSE)
- 公式: M S E = 1 n ∑ i = 1 n ( y i − y i ^ ) 2 MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y_i})^2 MSE=n1∑i=1n(yi−yi^)2
- 适用场景:主要用于回归任务,例如预测房价或气温。
- 解释:MSE 计算的是真实值 y i y_i yi 与预测值 y i ^ \hat{y_i} yi^ 之间的平方差。这个损失函数惩罚较大的误差,因此对异常值较为敏感。
2. 均方根误差(Root Mean Squared Error, RMSE)
- 公式: R M S E = 1 n ∑ i = 1 n ( y i − y i ^ ) 2 RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y_i})^2} RMSE=n1∑i=1n(yi−yi^)2
- 适用场景:同样适用于回归任务,其单位与输出变量一致,因此易于解释。
- 解释:与 MSE 类似,但在计算后进行了平方根处理,避免了过度放大大误差的影响。
3. 平均绝对误差(Mean Absolute Error, MAE)
- 公式: M A E = 1 n ∑ i = 1 n ∣ y i − y i ^ ∣ MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y_i}| MAE=n1∑i=1n∣yi−y