成为AI产品经理——回归模型评估（MSE、RMSE、MAE、R方）

原创已于 2023-12-04 18:13:51 修改

· 1.9k 阅读

·

23

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #产品经理 #回归

于 2023-12-04 13:59:11 首次发布

AI产品经理专栏收录该内容

18 篇文章

订阅专栏

分类问题的评估是看实际类别和预测类别是否一致，它的评估指标主要有混淆矩阵、AUC、KS。回归问题的评估是看实际值和预测值是否一致，它的评估指标包括MAE、MSE、RMSE、R方。

如果我们预测第二天某支股票的价格，给一个模型 y=1.5x，x是最近60天股票的价格的平均值，y是预测的第二天股票的结果。我们选择三支股票，记录它过去60天的均价，以及模型预测出来的价格和实际的价格。

下面的图片是将过去60天股票均价作为X轴，将股票价格作为Y轴做出的散点图。

我们想要算出预测和实际结果的差异，最原本的方法是直接将每一个样本的预测值和实际值做差，再将所有的差值结果进行相加。

它们的差值情况分别为：22-12=10，40-24=16，26-36=-10。可以看到Z公司的差值为-10，它与其他的差值相加会造成抵消误差的情况，所以这种方法不合理。

为了避免差值相互抵消的情况，我们将差值的平方相加。

$(22-12)^{2}+(40-24)^{2}+(26-36)^{2} = 456$

这种计算误差的方式在会受到样本个数的影响，在样本比较少的情况下它的误差会比较小，样本比较多的话，误差会较大。为了避免这种情况的出现，我们将平方和计算出来的误差除以样本个数就可以不受样本个数的影响，这种计算误差的方式我们称为均方误差。

一、MSE（均方误差）

$MSE=\frac{1}{n}\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}$

其中n：样本数量 $y_{i}$ :表示实际值 $\hat{y}_{i}$ :表示预测值

计算方式就是：样本的实际值和样本预测值差值的平方再除以样本数量。

这个值一定是大于等于0的，我们在评估的时候应该让这个值越小越好。

二、RMSE（均方根误差）

在使用均方误差对于值取平方的时候，会导致量纲发生变化，比如：我们计算的是米，但是平方之后是平方米，为了保持量纲一致，我们再对它开方，也就是均方根误差。

$RMSE = \sqrt[2]{MSE}=\sqrt[2]{\frac{1}{n}\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}$

这个数值结果也是越小越好的。

三、MAE（绝对平均值）

我们将差值取平方的原因是为了避免正负抵消操作，我们还可以使用差值取绝对值的方式来避免抵消，计算误差。

$MAE = \frac{1}{n}\sum_{i=1}^n\left|y{i}-\hat{y}_{i}\right|$

这个数值结果也是越小越好。

四、R方

在模型预测过程中，我们可能会想用同一个模型解决不同得问题。由于预测样本不一致，最终的预测结果可能会随着量纲的差异上至几万，下至几百。为了避免这种情况的出现，将误差使用0-1的概率表示出来，我们使用R方的计算公式。

$R^{2} = \frac{TSS-RSS}{TSS}$

$R^2$ 是实际结果和预测值之间相关系数的平方。

TSS：表示总离差平方和。就是实际值和实际值均值的差值平方和。

RSS：表示残差平方和。实际值和预测值之间的差值平方和。

它的值一般在0-1的范围内，越靠近1，说明模型预测的越准确。

我们继续使用上面股票预测的例子来说明这个R方的计算方法。

第一步：求实际值均值： $\frac{22+40+26}{3}=29.3$

第二步： $TSS=(22-29.3)^2+(40-29.3)^2+(26-29.3)^2$

第三步： $RSS = (22-12)^2+(40-24)^2+(26-36)^2$

第四步：带入 $R^{2}$ 公式， $R^2 = \frac{TSS+RSS}{TSS}$

五、误差公式选择

均方误差会进行差值平方，有一个数据放大的过程。均方根误差虽然平方再开方，但是还是会比实际的误差大，所以我们一般想要更接近误差的数据，选择MAE。

对于算法工程师而言，将误差放大有利于他们发现误差。算法工程师一般会选择MSE和RMSE。

六、总结

1.想获得更加真实的误差结果选择MAE，想要找到更明确的误差选择MSE。

2.如果想要将一个模型应用解决不同的问题时，选择 $R^2$ 可以看到模型在那个问题上表现得更好。

参考文献：刘海丰——《成为AI产品经理》自用，请勿传播

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。