R语言中基于混淆矩阵产生的衍生指标的计算及参数设置
混淆矩阵是评估分类模型性能的一种常用工具。它通过比较实际观测值和模型预测值的对应关系,将分类结果进行可视化和统计总结。除了常见的准确率、精确率和召回率等指标,我们还可以基于混淆矩阵计算一些衍生指标,来更全面地评估模型的性能。本文将介绍如何使用R语言计算基于混淆矩阵产生的衍生指标,并提供相应的源代码。
首先,我们需要创建一个混淆矩阵。假设我们有一个二分类模型,其中正类别为1,负类别为0。混淆矩阵的四个元素分别表示真正例(True Positive, TP)、假正例(False Positive, FP)、真反例(True Negative, TN)和假反例(False Negative, FN)。可以通过以下代码创建混淆矩阵:
actual <- c(1, 1, 0, 1, 0, 0, 1)
predicted <- c(1, 0, 0, 1, 0, 1, 1)
confusion_matrix <- table(actual, predicted)
接下来,我们可以使用混淆矩阵来计算一些衍生指标。
- 准确率(Accuracy):准确率表示模型正确预测的样本比例,可以通过以下代码计算: