R语言中的recall指标
在机器学习和数据分析中,指标是评估模型性能和结果的重要工具之一。recall(召回率)是一种常用的指标,用于衡量分类模型在识别正例(Positive)样本方面的性能。本文将介绍如何使用R语言计算recall指标,并提供相应的源代码示例。
首先,我们需要明确recall指标的定义。recall是指在所有真实正例样本中,模型正确识别出的正例样本的比例。它计算的是模型的敏感性,即模型对正例样本的识别能力。
假设我们有一个二分类模型,其输出结果为预测的类别标签(正例为1,负例为0),而真实的类别标签已知。为了计算recall指标,我们需要以下四个关键的统计量:真正例(True Positives, TP)、假负例(False Negatives, FN)、真负例(True Negatives, TN)和假正例(False Positives, FP)。
- 真正例(TP)是指模型正确预测为正例的样本数量。
- 假负例(FN)是指模型未能正确预测为正例的样本数量。
- 真负例(TN)是指模型正确预测为负例的样本数量。
- 假正例(FP)是指模型错误地预测为正例的样本数量。