从0开始学习机器学习--Day21--算法的评估标准

Chef_Chen

于 2024-11-10 22:40:12 发布

阅读量414

点赞数 4

CC 4.0 BY-SA版权

文章标签：学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Chef_Chen/article/details/143668397

准确率和召回率(precision and recall)

在上一章我们提到了在每次运行算法时通过返回一个实数值来判断算法的好坏，但是我们该如何构建这个实数的计算公式呢，毕竟这关乎于我们对算法的判断，不能过于夸大或贬低。有一个典型的会被影响的很大例子叫做偏斜类问题。

假如我们在一个机器学习算法的验证集中得到的错误率是1%，而另一个算法中的错误率是0.5%，那么是不是意味着第二个算法肯定比第一个好呢。实际上，假如我们的训练集中正样本和负样本的比例很极端，我们并不能武断地直接用预测正确率来判断算法好坏。就像我们刚刚说的，第二个算法的逻辑很简单，他总是预测结果是0，即负样本，那么在一个正负样本比例很极端的训练集中，后者有着天然的优势，所以单纯靠预测正确率来判断并不能检验算法的好坏，我们把这种样本集中一类比另一类样本多很多的问题称为偏斜类问题。

在遇到偏斜类问题时，我们一般会用叫做查准率和召回率的数据来判断算法的好坏。 $precision =\frac{true-positives}{all-of-predicted-positives}$ ，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。