MSE、RMSE、MAE、R方等指标整理

本文详细介绍了机器学习中常用的误差评估指标,包括SSE、MSE、RMSE、MAE、R²、MAPE等,并对比了它们的特点及适用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

SSE

SSE(sum squared error,和方差),其公式为: s s e = ∑ i = 1 m ( y i − y ^ i ) 2 sse=\sum_{i=1}^m(y_i-\hat y_i)^2 sse=i=1m(yiy^i)2其中, y i y_i yi是真实值, y ^ i \hat y_i y^i表示预测值。

MSE

MSE(mean squared error,均方误差),其公式为: m s e = 1 m ∑ i = 1 m ( y i − y ^ i ) 2 mse=\frac{1}{m}\sum_{i=1}^m(y_i-\hat y_i)^2 mse=m1i=1m(yiy^i)2其中, y i y_i yi是真实值, y ^ i \hat y_i y^i表示预测值。

作为模型评估时,MSE简单直白表达了预测误差,但是加了平方扩大了误差值,同时在量纲很大的情况下评估结果不明了,因为这个原因,作为损失函数训练模型时,模型受异常值的影响很大。

MSE通常作为线性回归模型的损失函数(L2 loss), J ( θ ) = − 1 m ∑ i = 1 m ( y i − h θ ( x i ) ) 2 J(\theta)=-\frac{1}{m}\sum\limits_{i=1}^m(y_i-h_\theta(x_i))^2 J(θ)=m1i=1m(yihθ(xi))2

MAE

MAE(mean absolute error,平均绝对误差),其公式为: m a e = 1 m ∑ i − 1 m ∣ y i − y ^ i ∣ mae=\frac{1}{m}\sum_{i-1}^m|y_i-\hat y_i| mae=m1i1myiy^i其中, y i y_i yi是真实值, y ^ i \hat y_i y^i表示预测值。

量纲和原值保持一致,且没有因为加了平方扩大了误差的问题,因此作为损失函数,其对于异常值的鲁棒性要高于MSE。

也被用作回归模型的损失函数(L1 loss)。

对于MSE和MAE:
如果数据的异常值对于业务是有用的,我们希望考虑到这些异常值,那么就用MSE;如果我们相应异常值只是一些无用的数据噪音,那就用MAE。

MAE是L1范数正则化的一个代表,MSE是L2范数正则化的一个代表。总体来说,L1可以克服异值点代来的不利影响。但是它的方程不可导,增大了用L1寻求最优解的困难度。L2对于异常点很敏感,但是通过求导很容易找到最优解。

这一点也可以联想到正则化模型进行特征选择时,虽然L1可以迅速把特征压缩到0,直接选择特征子集,但是如果特征之间存在共线性,L1可以带来不稳定的结果,即随意分配特征的权重。当数据发生细微变化时就会导致很大的模型差异。L2正则化就在系数权重上表现得更稳定,从而让特征更具解释性。

RMSE

RMSE(root mean squared error,均方根误差),其公式为: r m s e = m s e = 1 m ∑ i = 1 m ( y i − y ^ i ) 2 rmse=\sqrt {mse}=\sqrt{\frac{1}{m}\sum_{i=1}^m(y_i-\hat y_i)^2} rmse=mse =m1i=1m(yiy^i)2

RMSE本质是在MSE上作了一个开根号。这样将评估值的量纲和原值的量纲保持一致。

R 2 \textbf{R}^2 R2

R 2 R^2 R2(R squared,R方),其公式为: R 2 = 1 − S S r e s i d u a l S S t o t a l R^2=1-\frac{SS_{residual}}{SS_{total}} R2=1SStotalSSresidual其中 S S r e s i d u a l SS_{residual} SSresidual为residual sum of squares, S S t o t a l SS_{total} SStotal为total sum of squares。 R 2 = 1 − ∑ i ( y ^ ( i ) − y ( i ) ) 2 ∑ i ( y ˉ − y ( i ) ) 2 R^2=1-\frac{\sum\limits_{i}(\hat y^{(i)}-y^{(i)})^2}{\sum\limits_{i}(\bar y-y^{(i)})^2} R2=1i(yˉy(i))2i(y^(i)y(i))2其中, y ( i ) y^{(i)} y(i)是真实值, y ^ ( i ) \hat y^{(i)} y^(i)表示预测值, y ˉ \bar y yˉ表示样本均值, ∑ i ( y ^ ( i ) − y ( i ) ) 2 \sum\limits_{i}(\hat y^{(i)}-y^{(i)})^2 i(y^(i)y(i))2为预测产生的误差, ∑ i ( y ˉ − y ( i ) ) 2 \sum\limits_{i}(\bar y-y^{(i)})^2 i(yˉy(i))2为均值产生的误差。

  • R 2 ⩽ 1 R^2 \leqslant1 R21
  • R 2 R^2 R2越大越好。当预测模型不犯任何错误时, R 2 R^2 R2得到最大值1
  • 当预测模型等于基准模型时, R 2 = 0 R^2=0 R2=0
  • R 2 < 0 R^2 \lt 0 R2<0,说明预测模型还不如基准模型。
MAPE

MAPE(mean absolute percentage error,平均绝对百分比误差),其公式为: m a p e = 100 % n ∑ i = 1 n ∣ y ^ i − y i y i ∣ mape=\frac{100\%}{n}\sum_{i=1}^n|\frac{\hat y_i - y_i}{y_i}| mape=n100%i=1nyiy^iyi y i y_i yi是真实值, y ^ i \hat y_i y^i表示预测值。
范围[0,+∞),MAPE 为0%表示完美模型,MAPE 大于 100 %则表示劣质模型。可以看到,MAPE跟MAE很像,就是多了个分母。

注意:当真实值有数据等于0时,存在分母0除问题,该公式不可用!

<think>好的,用户之前问过关于如何用R从文本文件中提取回归评估指标的问题,现在他们想知道这些指标在什么范围内算好。我需要详细解释每个指标的含义和理想范围。 首先,用户可能在进行回归模型评估,需要了解各个指标的意义来判断模型表现。他们可能刚接触机器学习,对指标的理解不深,需要基础的解释。另外,用户可能想知道实际应用中这些指标的具体标准,以便优化模型。 MSERMSEMAE都是误差指标,值越小越好,但具体数值取决于数据范围。需要强调这些指标没有统一的标准,因为不同数据集的问题规模不同。比如预测房价和温度,误差值差异会很大,所以最好结合业务背景。 MAPE是百分比,通常低于10%算好,但也要看数据特性,比如零附近的值会导致MAPE不稳定,这时候可能需要其他指标。R²接近1更好,但不同领域对R²的要求可能不同,社会科学中0.3可能就不错了,而工程可能要求更高。 需要提醒用户注意这些指标的局限性,比如MSE对异常值敏感,MAPE的问题,以及R²的适用场景。还要建议综合多个指标和业务需求来评估模型,不能只看单一指标。 最后,给出实际例子帮助用户理解,比如房价预测的典型值范围,并强调没有绝对标准,需要具体情况分析。这样用户能更灵活地应用这些指标评估他们的模型。</think>以下是回归模型中常用评估指标的**理想范围说明**,使用时需结合具体数据和业务场景综合判断: --- ### **一、误差类指标(越小越好)** | 指标 | 数学表达式 | 理想范围 | 注意事项 | |------|------------|----------|----------| | **MSE**<br>(均误差) | $$MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2$$ | 无固定标准<br>(与数据量纲平相关) | 对异常值敏感,常用于理论推导 | | **RMSE**<br>(均根误差) | $$RMSE = \sqrt{MSE}$$ | 与数据量纲一致时,通常期望:<br>$RMSE < \text{数据标准差的50%}$ | 实际业务中更易解释 | | **MAE**<br>(平均绝对误差) | $$MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|$$ | 通常期望:<br>$MAE < \text{数据标准差的30%}$ | 对异常值鲁棒性强 | --- ### **二、百分比误差指标** | **MAPE**<br>(平均绝对百分比误差) | $$MAPE = \frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i - \hat{y}_i}{y_i}\right|$$ | |----------------------------------|----------------------------------------------------------------------------| | **理想范围** | • **<10%**: 优秀<br>• **10%-20%**: 良好<br>• **>20%**: 需改进 | | **注意** | 当数据含零或接近零时失效 | --- ### **三、拟合优度指标** | **R²**<br>(决定系数) | $$R^2 = 1 - \frac{\sum(y_i - \hat{y}_i)^2}{\sum(y_i - \bar{y})^2}$$ | |----------------------|------------------------------------------------------------------| | **理想范围** | • **0.6-1**: 强解释力<br>• **0.3-0.6**: 中等解释力<br>• **<0.3**: 需改进 | | **特殊场景** | 金融/社会科学领域可能接受更低的R²值 | --- ### **四、实际应用建议** 1. **对比基准**: - 对比「朴素预测」(如历史均值)的误差 - 优于基准值才有改进意义 2. **业务可接受性**(以房价预测为例): ```r # 假设房价单位是万元 RMSE = 5 → 平均误差±5万元 MAPE = 8% → 平均误差±8% ``` 3. **指标组合使用**: - 优先关注**RMSE + R²** - 异常值多时用**MAE + MAPE** - 避免单独依赖单一指标 --- ### **五、典型场景参考值** | 应用领域 | 较好RMSE范围 | 较好R²范围 | |----------------|--------------|------------| | 房价预测 | < 数据标准差的40% | >0.75 | | 销量预测 | < 数据标准差的50% | >0.6 | | 经济指标预测 | < 数据标准差的60% | >0.4 | --- **最终建议**:这些指标需结合具体业务目标解读。例如在医疗设备寿命预测中,MAE=3天可能很优秀,但在天气预报中RMSE=3℃可能不合格。实际应用中建议:1)建立业务误差容忍阈值 2)使用交叉验证观察指标稳定性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值