混淆矩阵——AI产品经理给我使劲看

混淆矩阵解析

原创已于 2024-06-03 10:21:37 修改 · 561 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #矩阵 #产品经理 #语言模型 #大模型 #算法

于 2024-06-03 10:15:11 首次发布

“ 而混淆矩阵就是有效评估模型精度的一种手段，它能够通过预测结果来评价模型的效果”

引言

作为汽车视觉算法功能产品经理，分类算法是一个常用的算法模型。

通过预先训练好一个分类模型，可以预测我们想要的正确值。例如在一堆动物图片中，把“狗”筛选出来。

而想要知道一个模型的预测精度或效果，就可以通过混淆矩阵（Confusion Matrix）来进行评价。

01

二分类模型

例如，我手里有个训练好的分类器，它可以在一堆车的图片中，判断哪些图片是极氪001。

现在如果我知道这个分类器的效果好不好，可以怎么办呢。

最简单有效的办法，就是把你手上拍的所有关于车的图片都丢给分类器，让他自己判断是不是极氪001。

经过分类器的一番分类后，我们就可以得到这样一个预测结果：

这个表格里，红色的×，代表“不是极氪001”；绿色的√，代表“是极氪001”。

这样一来我们就可以非常清晰的看到，模型的对于真实值的预测，是否正确。

但实际上，我们给到模型的图片，远不止这9张图。

为了保证测试结果的准确性，我们会给它成千上万张图来验证模型的效果。

显而易见，当他维度特别大的时候，我们就没办法用上面这个表格来很快看出这个模型的效果怎么样。

那有没有一种方式，能够很直观、很简单、而又不损失信息地表示这个模型的测试效果？

这个时候就需要用到混淆矩阵。

我们不难看出，以上预测结果的类型，其实是固定的。

真实类别也就是：【是极氪001】和【不是极氪001】两种情况

预测类别也同样是：【是极氪001】和【不是极氪001】两种情况

两两组合，其实一共就只有这个四种情况，也就是这样一个表格：

接下来，我们就需要对所有结果做一个统计，来看他有多少图片预测正确，有多少图片预测错误。

首先，我们来看他在所有【是极氪001】的图片中，预测对了几个，数了一下，一共有2个，所以这里就填“2”：

然后，在所有【不是极氪001】的图片中，一共预测对了4个，所以在这里就是“4”：

接着，看一下预测错误的情况，在所有【不是极氪001】的图片中，被模型判断成了【是极氪001】的情况一共有2次，所以这里就应该是“2”：

最后，在所有【是极氪001】的图片中，被模型判断成了【不是极氪001】的情况一共有1次。

所以最终，我们得到了这4个数，这4个数组成了一个2×2的矩阵，就叫做“混淆矩阵”（Confusion Matrix）。

也就是说，我们可以用这4个数来表示出这个模型的测试结果，也就能看出这个模型的测试效果。

同时，这四个数，分别有对应的名词来表示：

这两个绿色部分，代表预测对了，所以都是“True”开头；

同理，这两个红色部分，代表预测错了，所以都是“False”开头。

而第一行，模型都预测成了“Positive”（正向），所以第二个词就是“Positive”；

第二行，模型都预测成了“Negative”（负向），所以第二个词就是“Negative”。

于是就有了这个四个英文名词：True Positive、False Positive、False Negative、True Negative。

02

—

多分类模型

以上是针对二分类模型来说的，能告诉我们这些图片哪些是“极氪001”。

那比如我现在不想知道这些图片是不是极氪001，而是想知道这些图片中，哪些极氪、哪些是小鹏、哪些是蔚来。

那这个时候就变成了一个三分类模型，但原理其实和二分类是一样的，只不过他不再是个2×2矩阵，而是变成了3×3矩阵。

同样，绿色方块中是模型预测正确的部分，红色方块中是模型预测错误的部分。

再进一步，如果是N分类，那我们就可以得到一个N×N的矩阵。

同样，绿色部分是模型预测正确的部分，红色部分是模型预测错误的部分。

也就是说，在模型训练过程中，我们希望的是，模型预测正确的次数尽可能的多，预测错误的次数尽可能的少。

所以，在矩阵图里就是：绿色部分的数值越大，同时红色部分的数值越小，那么模型的效果越好；反之越差。

03

结语

AI产品经理不需要手把手自己训练模型，但需要把控模型的精度，为最终的结果负责。

而混淆矩阵就是有效评估模型精度的一种手段，它能够通过预测结果来评价模型的效果。

以上就是混淆矩阵的基本概念，希望说明白了。

如何转行/入门AI产品经理？

现在社会上大模型越来越普及了，已经有很多人都想往这里面扎，但是却找不到适合的方法去学习。

作为一名资深码农，初入大模型时也吃了很多亏，踩了无数坑。现在我想把我的经验和知识分享给你们，帮助你们学习AI大模型，能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习，等录播视频免费分享出来，需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势，它不仅能够为我们提供更多的机会和挑战，还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型，我们可以深入了解深度学习、神经网络等核心概念，并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时，掌握AI大模型还能够为我们的职业发展增添竞争力，成为未来技术领域的领导者。

再者，学习AI大模型也能为我们自己创造更多的价值，提供更多的岗位以及副业创收，让自己的生活更上一层楼。

因此，学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。