机器学习中的混淆矩阵

混淆矩阵是评估机器学习算法性能的重要工具,特别是在监督学习中。它显示了预测类别的实例与实际类别的对应关系。文章介绍了二类和多类案例下的混淆矩阵,并通过实例解释了准确率、真阳性率、真阴性率、召回率等关键性能指标。此外,还讨论了如何在Python中计算这些指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

混淆矩阵作为带有动物的图像

在我们的机器学习教程(前面的章节Python和NumPy的神经网络神经网络从头开始),我们实现的各种算法,但是我们没有正确地测量输出的质量。主要原因是我们使用非常简单的小数据集来学习和测试。在Neural Network: Testing with MNIST一章中,我们将使用大型数据集和 10 个类,因此我们需要适当的评估工具。本章我们将介绍混淆矩阵的概念:

混淆矩阵是可用于测量机器学习算法的性能的矩阵(表),通常是一个监督学习一个。混淆矩阵的每一行代表一个实际类的实例,每一列代表一个预测类的实例。这是我们在教程的这一章中保留它的方式,但也可以是相反的方式,即预测类的行和实际类的列。名称混淆矩阵反映了这样一个事实,即它让我们很容易看到我们的分类算法中发生了什么样的混淆。例如,算法应该将样本预测为C一世 因为实际的类是 C一世,但算法出来了 Cj. 在这种错误标记元素的情况下C米[一世,j] 构造混淆矩阵时,将增加 1。

我们将在以下课程中定义计算混淆矩阵、精度和召回率的方法。

2级案例

在 2 类情况下,即“负”和“正”,混淆矩阵可能如下所示:

预料到的
实际的 消极的 积极的
消极的 11 0
积极的 1 12

矩阵的字段含义如下:

预料到的
实际的 消极的 积极的
消极的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值