混淆矩阵——AI产品经理给我使劲看

而混淆矩阵就是有效评估模型精度的一种手段,它能够通过预测结果来评价模型的效果”

引言

作为汽车视觉算法功能产品经理,分类算法是一个常用的算法模型。

通过预先训练好一个分类模型,可以预测我们想要的正确值。例如在一堆动物图片中,把“狗”筛选出来。

而想要知道一个模型的预测精度或效果,就可以通过混淆矩阵(Confusion Matrix)来进行评价。

01

二分类模型

例如,我手里有个训练好的分类器,它可以在一堆车的图片中,判断哪些图片是极氪001。

现在如果我知道这个分类器的效果好不好,可以怎么办呢。

最简单有效的办法,就是把你手上拍的所有关于车的图片都丢给分类器,让他自己判断是不是极氪001。

图片

经过分类器的一番分类后,我们就可以得到这样一个预测结果:

图片

这个表格里,红色的×,代表“不是极氪001”;绿色的√,代表“是极氪001”。

这样一来我们就可以非常清晰的看到,模型的对于真实值的预测,是否正确。

但实际上,我们给到模型的图片,远不止这9张图。

为了保证测试结果的准确性,我们会给它成千上万张图来验证模型的效果。

显而易见,当他维度特别大的时候,我们就没办法用上面这个表格来很快看出这个模型的效果怎么样。

那有没有一种方式,能够很直观、很简单、而又不损失信息地表示这个模型的测试效果?

这个时候就需要用到混淆矩阵。

我们不难看出,以上预测结果的类型,其实是固定的。

真实类别也就是:【是极氪001】和【不是极氪001】两种情况

预测类别也同样是:【是极氪001】和【不是极氪001】两种情况

两两组合,其实一共就只有这个四种情况,也就是这样一个表格:

图片

接下来,我们就需要对所有结果做一个统计,来看他有多少图片预测正确,有多少图片预测错误。

首先,我们来看他在所有【是极氪001】的图片中,预测对了几个,数了一下,一共有2个,所以这里就填“2”:

图片

然后,在所有【不是极氪001】的图片中,一共预测对了4个,所以在这里就是“4”:

图片

接着,看一下预测错误的情况,在所有【不是极氪001】的图片中,被模型判断成了【是极氪001】的情况一共有2次,所以这里就应该是“2”:

图片

最后,在所有【是极氪001】的图片中,被模型判断成了【不是极氪001】的情况一共有1次。

所以最终,我们得到了这4个数,这4个数组成了一个2×2的矩阵,就叫做“混淆矩阵”(Confusion Matrix)。

图片

也就是说,我们可以用这4个数来表示出这个模型的测试结果,也就能看出这个模型的测试效果。

同时,这四个数,分别有对应的名词来表示:

图片

这两个绿色部分,代表预测对了,所以都是“True”开头;

同理,这两个红色部分,代表预测错了,所以都是“False”开头。

而第一行,模型都预测成了“Positive”(正向),所以第二个词就是“Positive”;

第二行,模型都预测成了“Negative”(负向),所以第二个词就是“Negative”。

于是就有了这个四个英文名词:True Positive、False Positive、False Negative、True Negative。

02

多分类模型

以上是针对二分类模型来说的,能告诉我们这些图片哪些是“极氪001”。

那比如我现在不想知道这些图片是不是极氪001,而是想知道这些图片中,哪些极氪、哪些是小鹏、哪些是蔚来。

那这个时候就变成了一个三分类模型,但原理其实和二分类是一样的,只不过他不再是个2×2矩阵,而是变成了3×3矩阵。

图片

图片

图片

同样,绿色方块中是模型预测正确的部分,红色方块中是模型预测错误的部分。

再进一步,如果是N分类,那我们就可以得到一个N×N的矩阵。

图片

同样,绿色部分是模型预测正确的部分,红色部分是模型预测错误的部分。

也就是说,在模型训练过程中,我们希望的是,模型预测正确的次数尽可能的多,预测错误的次数尽可能的少。

所以,在矩阵图里就是:绿色部分的数值越大,同时红色部分的数值越小,那么模型的效果越好;反之越差。

03

结语

AI产品经理不需要手把手自己训练模型,但需要把控模型的精度,为最终的结果负责。

而混淆矩阵就是有效评估模型精度的一种手段,它能够通过预测结果来评价模型的效果。

以上就是混淆矩阵的基本概念,希望说明白了。

如何转行/入门AI产品经理?

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值