混淆矩阵及其绘制与归一化
混淆矩阵(Confusion Matrix)是在机器学习和分类问题中常用的评估工具。它用于可视化分类模型的性能,并以表格形式展示模型在测试数据集上的预测结果与实际标签之间的差异。本文将介绍混淆矩阵的概念,并使用Python演示如何绘制和归一化混淆矩阵。
混淆矩阵概述
混淆矩阵是一个二维矩阵,用于描述分类模型在测试数据集上的分类结果。它将实际标签与预测标签进行对比,并将它们分为四个不同的分类:真正例(True Positive, TP)、假正例(False Positive, FP)、真反例(True Negative, TN)和假反例(False Negative, FN)。这些分类可以用以下方式表示:
- TP:模型正确地将样本预测为正例。
- FP:模型错误地将样本预测为正例。
- TN:模型正确地将样本预测为反例。
- FN:模型错误地将样本预测为反例。
混淆矩阵的形式如下:
| 预测正例 | 预测反例 |
----------|-----------|-----------|
实际正例 | TP | FN |
----------|-----------|-----------|
实际反例 | FP | TN |
----------|-----------|-----------|
绘制混淆矩阵
要在Python中绘制混淆矩阵,我们可以使用一些常