每天五分钟机器学习:为什么平方损失很高,但模型准确率却很好?

本文探讨了机器学习中一个反常现象:模型平方损失高但准确率良好的原因。平方损失函数(RMSE)易受离群点影响,而高准确率可能源于数据集中离群点的存在。解决方案包括数据预处理去除离群点、建立复杂模型和改用MAPE作为评估指标。

本文重点

在机器学习模型学习的过程中,可能会出现一个特别奇怪的现象,平方损失非常高,但是准确率却很高,那么这个模型的效果还是不错的。前面我们介绍过平方损失也是评价指标之一,那么这样的话,平方损失RMSE就失效了。

平方损失函数(RMSE)

 

平方损失函数的图像如上所示,x(i)表示第i个样本,hθ(x(i))表示第i个样本的预测值,y(i)表示第i个样本的真实值。也就是说RMSE是很容易反映回归模型预测值与真实值的偏离程度。

出现问题的原因

出现平方误差大,但是准确率高的原因可能是存在噪音点,如果出现个别偏离程度非常大的离群点时,就有可能使得平方损失非常大。

解决方法

1、在数据预处理的时候,直接将这些离群点给过滤掉

2、建立更加复杂的模型,将离群点产生的原因考虑进来

3、使用平均绝对百分比误差(MAPE)代替RMSE

 

MAPE 为0%表示完美模型,MAPE 大于 100 %则表示劣质模型。相比于RMSE,MAPE相当于把每个点的误差进行了归一化,降低了个别离群点带来的影响。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能_AI

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值