precision和recall

最新推荐文章于 2025-06-04 20:19:48 发布

洗澡鸭

最新推荐文章于 2025-06-04 20:19:48 发布

阅读量5k

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习

本文链接：https://blog.youkuaiyun.com/linfy16/article/details/82809425

深度学习专栏收录该内容

7 篇文章

订阅专栏

本文深入解析了机器学习中的两个关键概念：精确率和召回率。精确率是指在被判断为真的样例中，实际为真的样例比例，而召回率是在实际为真的样例中，被判断为真的样例比例。文章还讨论了如何通过调整阈值来控制精确率和召回率，并介绍了F1-score作为评估算法效果的综合指标。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

precision vs recall

precision:精确率。在被判断为真的样例中，实际为真的样例比例。
$\,positive/predicted \,positive$
recall:召回率。在实际为真的样例中，被判断为真的样例比例。
$\,positive/actual \,positive$
precision越高，假阳性出现的概率越低。
recall越高，假阴性出现的概率越低。
e.g.cat vs non-cat 分类器

空白	判断是猫	判断非猫
是猫	x1	x2
非猫	y1	y2

$P = x 1 / (x 1 + x 2)$
$R = x 1 / (x 1 + y 1)$

控制precision和recall

$\,y_{hat}>=threshold,then\, y=1$
$e l s e, y = 0$
降低threshold:更不容易被判断为阴性，减少假阴性，recall变大
提高threshold:更不容易被判断为阳性，减少假阳性，precision变大

用一个数衡量算法的效果

$F 1 - s c o r e = 2 / (1 / P + 1 / R)$
$F 1 - s c o r e$ 越大，效果越好。
为什么不用算术平均？
$F 2 - s c o r e = (P + R) / 2$
假设一个算法，无论对什么输入，都输出y=0
那么这个算法的假阳性发生概率为0，P=1；没有true positive,R=0。
因此，F2-score的成绩还是不错的，甚至要超过一些比它更有用的算法，因为R大大拉高了平均成绩。
但是在调和平均中，P,R任何一方为0，都会导致分母无穷大，从而F1-score=0