混淆矩阵评估分类模型的其他指标及R语言实现
混淆矩阵是评估分类模型性能的常用工具。除了准确率之外,还有许多其他指标可以从混淆矩阵中计算得到。本文将介绍一些常见的混淆矩阵相关指标,并使用R语言提供实现代码。
首先,我们需要一个分类模型的预测结果和真实标签数据。假设我们有一个二元分类问题,其中预测结果保存在一个名为"predictions"的向量中,真实标签保存在一个名为"labels"的向量中。以下是一个示例数据:
predictions <- c(1, 0, 1, 1, 0, 0, 1, 0, 0, 1)
labels <- c(1, 0, 1, 0, 1, 0, 1, 0, 1, 1)
接下来,我们可以使用混淆矩阵函数confusionMatrix()
来计算各种指标。该函数可以在caret
包中找到,如果你没有安装它,可以先使用install.packages("caret")
进行安装。
- 真阳性(True Positive)和真阴性(True Negative)
真阳性表示预测为正类且真实为正类的样本数量,真阴性表示预测为负类且真实为负类的样本数量。在混淆矩阵中,它们分别位于第一行第一列和第二行第二列。
library(caret)
cm <- confusionMatrix(predictions, labels)
tp <- cm$table[2, 2]
tn <- cm