机器学习之回归模型预测性能评估指标(RMSE、MSE、MAE、MAPE、SMAPE、R^2 Score、R^2 )

一、机器学习简介

机器学习就是通过大量的数据进行训练,然后得出输入数据的模型特征;再次输入相关的数据时,能得到一个预测的结果。这在现实生活中解决了大量的问题,如:股票预测、物体分类、房价预测等等,这些都依赖机器学习带给我们的便利。

机器学习中又分为两大类:监督学习非监督学习。

而监督学习中又分为回归问题分类问题

本文章中主要讲回归问题

二、回归模型的评估指标

假设:

预测值:

 

真实值:

2.1 平均绝对误差 Mean Absolute Error  ( MAE )

平均绝对误差 MAE,也叫平均绝对离差;在计算的时候,先对真实值与预测值求和,然后再取平均值。

公式:

范围 [0, +∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

2.2 平均绝对百分误差 Mean Absolute Percentage Error ( MAPE )

平均绝对百分误差是对 MAE 改进后,通过计算真实值与预测的误差百分比避免了数据范围大小的影响

公式:

范围[0,+∞),MAPE 为0%表示完美模型,MAPE 大于 100 %则表示劣质模型。

可以看到,MAPE跟MAE很像,就是多了个分母。

注意点:当真实值有数据等于0时,存在分母0除问题,该公式不可用!

 2.3 均方误差 Mean Square Error( MSE )

均方误差就是对平均绝对误差求平方根,这个指标在计算时,先对真实值与预测值的距离平方后求和,再取平均值。

公式:

 范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

一方面,该指标避免了MAE的绝对值导致函数不能求导的问题,因此均方误差常用于线性回归的损失函数;另一方面,均方误差可以通过平方来放大预测偏差较大的值,提高了检测的灵敏度

 2.4 均方根误差 Root Mean Square Error ( RMSE )

均方根误差(Root Mean Square Error),其实就是MSE加了个根号,这样数量级上比较直观,比如RMSE=10,可以认为回归效果相比真实值平均相差10。

公式:

 范围[0,+∞),当预测值与真实值完全吻合时等于0,即完美模型;误差越大,该值越大。

2.5 对称平均绝对百分比误差Symmetric Mean Absolute Percentage Error (SMAPE )

公式:

注意点:当真实值有数据等于0,而预测值也等于0时,存在分母0除问题,该公式不可用!

2.6 决定系数 R^2 Score

该指标需要了解另外三个指标:

Sum of Squares of the Regression,SSR

计算预测数据与真实数据均值之差的平方和,反映的是模型数据相对真实数据均值的离散程度

Total Sum of Squares,SST

计算真实数据和其均值之差的平方和,反映的是真实数据相对均值的离散程度

 Sum of Squares for Error,SSE

真实数据和预测数据之差的平方和

 细心的小伙伴可能注意到,SST = SSR + SSE

2.7 决定系数 R^2

决定系数 R^2,通过计算SSR 与 SST的比值,反应因变量 y 的全部变异能通过回归模型被自变量 x 解释的比例。比如,R^2 为0.9,则表示回归关系可以解释因变量 90% 的变异。

  • 决定系数R2越高,越接近于1,模型的拟合效果就越好
  • 决定系数R2越接近于0,回归直线拟合效果越差。

R^2  虽然可以评价回归模型效果,但会随着自变量数量的不断增加而改变。

三、python代码

# coding=utf-8
import numpy as np
from sklearn import metrics

# MAPE和SMAPE需要自己实现
def mape(y_true, y_pred):
    return np.mean(np.abs((y_pred - y_true) / y_true)) * 100

def smape(y_true, y_pred):
    return 2.0 * np.mean(np.abs(y_pred - y_true) / (np.abs(y_pred) + np.abs(y_true))) * 100

y_true = np.array([1.0, 5.0, 4.0, 3.0, 2.0, 5.0, -3.0])
y_pred = np.array([1.0, 4.5, 3.5, 5.0, 8.0, 4.5, 1.0])

# MSE
print(metrics.mean_squared_error(y_true, y_pred)) # 8.107142857142858
# RMSE
print(np.sqrt(metrics.mean_squared_error(y_true, y_pred))) # 2.847304489713536
# MAE
print(metrics.mean_absolute_error(y_true, y_pred)) # 1.9285714285714286
# MAPE
print(mape(y_true, y_pred)) # 76.07142857142858,即76%
# SMAPE
print(smape(y_true, y_pred)) # 57.76942355889724,即58%

后面我也会继续创作连载

创作不易,欢迎点赞收藏,支持作者创作

<think>好的,用户之前问过关于如何用R从文本文件中提取回归评估指标的问题,现在他们想知道这些指标在什么范围内算好。我需要详细解释每个指标的含义和理想范围。 首先,用户可能在进行回归模型评估,需要了解各个指标的意义来判断模型表现。他们可能刚接触机器学习,对指标的理解不深,需要基础的解释。另外,用户可能想知道实际应用中这些指标的具体标准,以便优化模型。 MSERMSEMAE都是误差指标,值越小越好,但具体数值取决于数据范围。需要强调这些指标没有统一的标准,因为不同数据集的问题规模不同。比如预测房价和温度,误差值差异会很大,所以最好结合业务背景。 MAPE是百分比,通常低于10%算好,但也要看数据特性,比如零附近的值会导致MAPE不稳定,这时候可能需要其他指标。R&sup2;接近1更好,但不同领域对R&sup2;的要求可能不同,社会科学中0.3可能就不错了,而工程可能要求更高。 需要提醒用户注意这些指标的局限性,比如MSE对异常值敏感,MAPE的问题,以及R&sup2;的适用场景。还要建议综合多个指标和业务需求来评估模型,不能只看单一指标。 最后,给出实际例子帮助用户理解,比如房价预测的典型值范围,并强调没有绝对标准,需要具体情况分析。这样用户能更灵活地应用这些指标评估他们的模型。</think>以下是回归模型中常用评估指标的**理想范围说明**,使用时需结合具体数据和业务场景综合判断: --- ### **一、误差类指标(越小越好)** | 指标 | 数学表达式 | 理想范围 | 注意事项 | |------|------------|----------|----------| | **MSE**<br>(均方误差) | $$MSE = \frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2$$ | 无固定标准<br>(与数据量纲平方相关) | 对异常值敏感,常用于理论推导 | | **RMSE**<br>(均方根误差) | $$RMSE = \sqrt{MSE}$$ | 与数据量纲一致时,通常期望:<br>$RMSE < \text{数据标准差的50%}$ | 实际业务中更易解释 | | **MAE**<br>(平均绝对误差) | $$MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|$$ | 通常期望:<br>$MAE < \text{数据标准差的30%}$ | 对异常值鲁棒性强 | --- ### **二、百分比误差指标** | **MAPE**<br>(平均绝对百分比误差) | $$MAPE = \frac{100\%}{n}\sum_{i=1}^{n}\left|\frac{y_i - \hat{y}_i}{y_i}\right|$$ | |----------------------------------|----------------------------------------------------------------------------| | **理想范围** | • **<10%**: 优秀<br>• **10%-20%**: 良好<br>• **>20%**: 需改进 | | **注意** | 当数据含零或接近零时失效 | --- ### **三、拟合优度指标** | **R&sup2;**<br>(决定系数) | $$R^2 = 1 - \frac{\sum(y_i - \hat{y}_i)^2}{\sum(y_i - \bar{y})^2}$$ | |----------------------|------------------------------------------------------------------| | **理想范围** | • **0.6-1**: 强解释力<br>• **0.3-0.6**: 中等解释力<br>• **<0.3**: 需改进 | | **特殊场景** | 金融/社会科学领域可能接受更低的R&sup2;值 | --- ### **四、实际应用建议** 1. **对比基准**: - 对比「朴素预测」(如历史均值)的误差 - 优于基准值才有改进意义 2. **业务可接受性**(以房价预测为例): ```r # 假设房价单位是万元 RMSE = 5 → 平均误差±5万元 MAPE = 8% → 平均误差±8% ``` 3. **指标组合使用**: - 优先关注**RMSE + R&sup2;** - 异常值多时用**MAE + MAPE** - 避免单独依赖单一指标 --- ### **五、典型场景参考值** | 应用领域 | 较好RMSE范围 | 较好R&sup2;范围 | |----------------|--------------|------------| | 房价预测 | < 数据标准差的40% | >0.75 | | 销量预测 | < 数据标准差的50% | >0.6 | | 经济指标预测 | < 数据标准差的60% | >0.4 | --- **最终建议**:这些指标需结合具体业务目标解读。例如在医疗设备寿命预测中,MAE=3天可能很优秀,但在天气预报中RMSE=3℃可能不合格。实际应用中建议:1)建立业务误差容忍阈值 2)使用交叉验证观察指标稳定性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

花开花落与云卷云舒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值