混淆矩阵及其绘制和归一化
混淆矩阵(Confusion Matrix),又称为误差矩阵,是用于评估分类模型效果的常用指标。它展示了分类器的预测结果与真实情况之间的关系,从而帮助我们更好地了解模型的表现。在本文中,我们将学习如何生成混淆矩阵,并对其进行可视化和归一化。
生成混淆矩阵
在Python中,可以使用sklearn.metrics库中的confusion_matrix函数生成混淆矩阵。这个函数需要两个参数:真实值和预测值。假设我们有一个真实值数组y_true和一个预测值数组y_pred,则可以使用以下代码生成混淆矩阵:
from sklearn.metrics import confusion_matrix
import numpy as np
y_true = np.array([1, 0, 1, 1, 0, 1])
y_pred = np.array([0, 0, 1, 1, 0, 1])
cm = confusion_matrix(y_true, y_pred)
print(cm)
在这个例子中,真实值数组包含了6个样本,每个样本以1或0表示。预测值数组也是如此。通过运行以上代码,我们可以得到以下的输出:
[[2 0]
[1 3]]
这就是混淆矩阵的矩阵形式。混淆矩阵由4个数字组成,从左到右和从上到下依次表示真实负样本数、假阳