本文重点
从本文开始我们将学习准确率这个评价指标,准确率是所有评价指标中最简单的评价指标了。比如我们上学的时候,我们做选择题,一共10道,我们做对了7道,那么我们可以认为准确率为70%。
准确率的定义
准确率是指分类正确的样本占总样本个数的比例,用公式表示就是:

准确率的优点
直观易懂:准确率作为比例值,其大小直接反映了模型预测的正确程度,易于理解和解释。
计算简便:准确率的计算仅涉及简单的加法和除法运算,计算过程简便快捷。
广泛应用:在分类问题中,准确率是最常用的评估指标之一,尤其适用于类别分布相对均衡的数据集。
准确率的缺点
对类别不平衡敏感:当数据集中各类别的样本数量极不均衡时,准确率可能无法真实反映模型的性能。比如现在有一个数据集中有100个样本,其中99个样本类别为1,而1个严格不能类别为0,那么我们直接构建一个分类器,这个分类器可以将所有样本都预测为类别为1,那么此时分类器的准确率就是99%,这个准确率够高了,但是此时的分类器却是死的,因为它对任何样本的结果都预测类别为1。
忽略具体类别的表现:准确率只关注整体预测正确的比例,而不考虑模型在各个类别上的具体表现。在某些情况下,我们可能更关心模型在特定类别上的预测能力。
不适用于多标签分类:在多标签分类问题中,一个样本可能同时属于多个类别,此时准确率无法直接应用。
本文介绍了机器学习中的准确率,作为最简单的评价指标,准确率是分类正确的样本占比。然而,当数据集不平衡时,准确率可能无法反映模型性能。为了解决这一问题,文章提到了平均准确率,即按类别划分的准确率,它能更客观地评价模型在数据不平衡情况下的表现。
订阅专栏 解锁全文
2794

被折叠的 条评论
为什么被折叠?



