在机器学习、信息检索等领域,召回率(Recall) 和准确率(Precision) 是评估模型性能的两个核心指标,它们从不同角度衡量模型的效果,适用场景也存在显著差异,结果的解释对现实也有着不同的指导意义。
定义与核心关注点
准确率
召回率
举例说明
假设一个癌症筛查模型,对 100 名实际患病者(正例)和 900 名健康人(负例)进行预测,结果如下:
- 真正例(TP):95 人(95 名患者被正确诊断)
- 假正例(FP):50 人(50 名健康人被误判为患病)
- 假负例(FN):5 人(5 名患者被漏诊)
则:
- 准确率 = 95 / (95 + 50) = 65.5%(模型预测为 “患病” 的人里,只有 65.5% 是真的患病(剩下 34.5% 是健康人被误诊)
- 召回率 = 95 / (95 + 5) = 95%(所有实际患病的人里,95% 被模型筛查出来了,有 5% 漏诊)
因此:
- 准确率关注 “预测为正例的可靠性”(少误诊);
- 召回率关注 “实际正例的覆盖率”(少漏诊)。