成为AI产品经理——回归模型评估(MSE、RMSE、MAE、R方)

分类问题的评估是看实际类别和预测类别是否一致,它的评估指标主要有混淆矩阵、AUC、KS。回归问题的评估是看实际值和预测值是否一致,它的评估指标包括MAE、MSE、RMSE、R方。

如果我们预测第二天某支股票的价格,给一个模型 y=1.5x,x是最近60天股票的价格的平均值,y是预测的第二天股票的结果。我们选择三支股票,记录它过去60天的均价,以及模型预测出来的价格和实际的价格。

下面的图片是将过去60天股票均价作为X轴,将股票价格作为Y轴做出的散点图。

我们想要算出预测和实际结果的差异,最原本的方法是直接将每一个样本的预测值和实际值做差,再将所有的差值结果进行相加。

它们的差值情况分别为:22-12=10,40-24=16,26-36=-10。可以看到Z公司的差值为-10,它与其他的差值相加会造成抵消误差的情况,所以这种方法不合理。

为了避免差值相互抵消的情况,我们将差值的平方相加。

(22-12)^{2}+(40-24)^{2}+(26-36)^{2} = 456

这种计算误差的方式在会受到样本个数的影响,在样本比较少的情况下它的误差会比较小,样本比较多的话,误差会较大。为了避免这种情况的出现,我们将平方和计算出来的误差除以样本个数就可以不受样本个数的影响,这种计算误差的方式我们称为均方误差

一、MSE(均方误差)

MSE=\frac{1}{n}\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}

其中n:样本数量  y_{i}:表示实际值 \hat{y}_{i}:表示预测值

计算方式就是:样本的实际值和样本预测值差值的平方再除以样本数量。

这个值一定是大于等于0的,我们在评估的时候应该让这个值越小越好

二、RMSE(均方根误差)

在使用均方误差对于值取平方的时候,会导致量纲发生变化,比如:我们计算的是米,但是平方之后是平方米,为了保持量纲一致,我们再对它开方,也就是均方根误差

RMSE = \sqrt[2]{MSE}=\sqrt[2]{\frac{1}{n}\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}

这个数值结果也是越小越好的。 

三、MAE(绝对平均值)

我们将差值取平方的原因是为了避免正负抵消操作,我们还可以使用差值取绝对值的方式来避免抵消,计算误差。

MAE = \frac{1}{n}\sum_{i=1}^n\left|y{i}-\hat{y}_{i}\right|

这个数值结果也是越小越好。 

四、R方

在模型预测过程中,我们可能会想用同一个模型解决不同得问题。由于预测样本不一致,最终的预测结果可能会随着量纲的差异上至几万,下至几百。为了避免这种情况的出现,将误差使用0-1的概率表示出来,我们使用R方的计算公式。

R^{2} = \frac{TSS-RSS}{TSS}

R^2是实际结果和预测值之间相关系数的平方。

TSS:表示总离差平方和。就是实际值和实际值均值的差值平方和。

RSS:表示残差平方和。实际值和预测值之间的差值平方和。

它的值一般在0-1的范围内,越靠近1,说明模型预测的越准确。 

我们继续使用上面股票预测的例子来说明这个R方的计算方法。

第一步:求实际值均值:\frac{22+40+26}{3}=29.3 

第二步:TSS=(22-29.3)^2+(40-29.3)^2+(26-29.3)^2 

第三步:RSS = (22-12)^2+(40-24)^2+(26-36)^2 

第四步:带入R^{2}公式,R^2 = \frac{TSS+RSS}{TSS} 

五、误差公式选择

均方误差会进行差值平方,有一个数据放大的过程。均方根误差虽然平方再开方,但是还是会比实际的误差大,所以我们一般想要更接近误差的数据,选择MAE。

对于算法工程师而言,将误差放大有利于他们发现误差。算法工程师一般会选择MSE和RMSE。

六、总结

1.想获得更加真实的误差结果选择MAE,想要找到更明确的误差选择MSE。

2.如果想要将一个模型应用解决不同的问题时,选择R^2可以看到模型在那个问题上表现得更好。

参考文献:刘海丰——《成为AI产品经理》 自用,请勿传播 

回答: 在回归模型中,我们可以使用MAE(平均绝对误差),MSE(均误差)和RMSE(均根误差)来评估模型的性能。MAE是预测值与实际值之间差值的绝对值的平均值,MSE是预测值与实际值之间差值的平的平均值,而RMSEMSE的平根。\[1\]通常情况下,我们希望这些误差越小越好,因为它们表示了模型的预测与实际值之间的差异程度。因此,当我们比较不同的回归模型时,我们可以使用这些指标来判断模型的好坏。如果MAEMSERMSE都较小,那么我们可以认为该回归模型较好。\[1\]此外,我们还可以使用残差图来评估回归模型的适用性。如果数据点在没有图案的线上随机分布,那么线性回归模型非常适合数据,否则我们应该考虑使用非线性模型。\[2\] #### 引用[.reference_title] - *1* *2* [回归问题的评价指标 MAE MSE RMSE R2 score Adjusted R2 score 和 重要知识点总结](https://blog.youkuaiyun.com/HzauTriste/article/details/127562028)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [回归模型评估指标(MAEMSERMSE、R²、MAPE)](https://blog.youkuaiyun.com/y15659037739l/article/details/123971286)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值