使用R语言计算混淆矩阵评估分类模型性能
混淆矩阵是用于评估分类模型性能的重要工具,它可以展示模型在不同类别上的预测结果与真实标签之间的关系。在本文中,我们将介绍如何使用R语言中的table函数来计算混淆矩阵,并从中获取一些常见的性能指标。
首先,我们需要准备一个分类模型并进行预测。在这里,我们使用一个简单的例子来说明,假设我们正在构建一个二元分类器来预测邮件是否为垃圾邮件。我们有一组已知的样本数据,每个样本都有两个特征:邮件正文内容以及是否包含垃圾关键词。我们已经训练好了一个模型,并用它来对一批新的邮件进行分类预测。
下面是一个简化的示例代码,用于生成随机的预测结果:
# 生成随机的真实标签和预测结果
n <- 1000
true_labels <- sample(c("spam", "ham"), n, replace = TRUE)
predicted_labels <- sample(c("spam", "ham"), n, replace = TRUE)
接下来,我们可以使用table函数计算混淆矩阵:
# 计算混淆矩阵
confusion_matrix <- table(true_labels, predicted_labels)
计算得到的混淆矩阵将会是一个2x2的矩阵,如下所示:
predicted_labels
true_labels spam ham
spam a b