R语言中的回忆(Recall)指标
回忆(Recall)是在机器学习中常用的性能指标之一。它用于评估分类模型在识别正例(Positive)样本时的准确性。回忆关注的是所有真实正例中,模型能够正确识别出多少个。
在R语言中,我们可以使用不同的函数和库来计算回忆指标。下面将介绍一些常见的方法,并提供相应的源代码。
- 使用
caret
包
caret
包是R中一个非常常用的机器学习工具包,它提供了一系列函数和方法来进行模型训练和评估。
首先,在计算回忆前,我们需要先建立一个分类模型。这里以随机森林(Random Forest)为例:
library(caret)
# 准备数据
data <- your_data # 替换成你的数据集
trainIndex <- createDataPartition(data$label, p = 0.8, list = FALSE)
trainData <- data[trainIndex, ]
testData <- data[-trainIndex, ]
# 建立模型
model <- train(label ~ ., data = trainData, method = "rf")
# 预测
predictions <- predict(model, testData)
# 计算回忆
recall <- confusionMatrix(predictions, testData$label)$byClass["Recall"]
<