关于准确率accuracy和召回率recall的理解

最新推荐文章于 2025-09-13 12:05:07 发布

原创

最新推荐文章于 2025-09-13 12:05:07 发布 · 1.4k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

本文介绍了在100个样本中，机器学习模型如何预测正负样本的情况。70个正样本中，模型正确预测了50个（TP），错误预测了20个（FN）。30个负样本中，模型错误预测了10个为正（FP），正确预测了20个为负（TN）。准确率accuracy基于模型的正样本预测，而召回率recall则关注实际正样本的预测情况。

假设有100个样本，其中正样本70，负样本30，这个是由数据集本身决定的，机器要做的就是判别这100个样本中哪几个样本是正样本，哪几个样本是负样本。

现在机器做出了预测：
机器把原样本中70个正样本中的50个判为正，记为TP=50(True Positive,机器判断正确的正样本)；
机器把原样本中70个正样本中的20个判为负，记为FN=50(False Negative,机器判断错误，认为该样本是负样本，但它是正样本。可以理解为“机器错误的认为它是负样本，负负得正所以它本来的面目应该是正样本”)；
机器把原样本中30个负样本中的10个判为正，记为FP=10(False Positive,机器判断错误，认为该样本是正样本，但它是负样本。可以理解为“机器错误的认为它是正样本，那它本来的面目是负样本”)；
机器把原样本中30个负样本中的20个判为负，记为TN=20(True Negative,机器判断正确的负样本)；

$accuracy=TPTP+FPaccuracy=\frac{TP}{TP + FP}$