混淆矩阵及其绘制和归一化

最新推荐文章于 2025-11-08 18:48:48 发布

CodeWG

最新推荐文章于 2025-11-08 18:48:48 发布

阅读量1.4k

点赞数 1

CC 4.0 BY-SA版权

文章标签：矩阵 python 线性代数

本文链接：https://blog.youkuaiyun.com/CodeWG/article/details/131180206

Python学习专栏收录该内容

575 篇文章 ¥59.90 ¥99.00

订阅专栏

本文介绍了混淆矩阵的概念，用于评估分类模型的效果。通过Python的sklearn.metrics库生成混淆矩阵，并利用seaborn库进行可视化。同时，讨论了归一化混淆矩阵在理解模型表现上的重要性。

混淆矩阵及其绘制和归一化

混淆矩阵（Confusion Matrix），又称为误差矩阵，是用于评估分类模型效果的常用指标。它展示了分类器的预测结果与真实情况之间的关系，从而帮助我们更好地了解模型的表现。在本文中，我们将学习如何生成混淆矩阵，并对其进行可视化和归一化。

生成混淆矩阵

在Python中，可以使用sklearn.metrics库中的confusion_matrix函数生成混淆矩阵。这个函数需要两个参数：真实值和预测值。假设我们有一个真实值数组y_true和一个预测值数组y_pred，则可以使用以下代码生成混淆矩阵：

from sklearn.metrics import confusion_matrix
import numpy as np

y_true = np.array([1, 0, 1, 1, 0, 1])
y_pred = np.array([0, 0, 1, 1, 0, 1])

cm = confusion_matrix(y_true, y_pred)
print(cm)

在这个例子中，真实值数组包含了6个样本，每个样本以1或0表示。预测值数组也是如此。通过运行以上代码，我们可以得到以下的输出：

[[2 0]
 [1 3]]

这就是混淆矩阵的矩阵形式。混淆矩阵由4个数字组成，从左到右和从上到下依次表示真实负样本数、假阳性数、假阴性数、真正样本数。

绘制混淆矩阵

虽然矩阵可以很好地表达混淆矩阵，但是它不一定很容易理解。我们可以使用heatmap图像来更直观地呈现混淆矩阵。在此用seaborn库创建一个heatmap，同时设置anno

了解本专栏