线性分类器评估与目标检测技术解析
1. 线性分类器概述
线性分类器有多种算法,感知机、逻辑回归和支持向量机(SVM)只是其中一部分,还有线性判别分析(LDA)和朴素贝叶斯等。SVM 算法还被扩展到回归问题领域,衍生出支持向量回归算法。
2. 二分类器的评估指标
2.1 准确性的局限性
在解决分类问题时,我们常常会得到多个不同的模型。直观上,准确率最高的模型似乎是不错的选择,准确率的计算公式为:
[
\text{accuracy} = \frac{\text{correct predictions}}{\text{total predictions}}
]
然而,实际情况并非如此简单。例如,在预测患者是否处于严重疾病早期阶段的任务中,假设平均每 100 名患者中只有 5 人患病。一个总是预测患者没有患病的模型,准确率可达 95%,但实际上毫无用处。而一个能正确识别出 5 名患病患者中的 4 名,同时错误地将另外 5 名健康患者识别为患病的模型,准确率仅为 94%,但作为初步筛选需要进一步检查的患者的工具,它却更有用。这表明,除了准确率,我们还需要考虑其他指标。
2.2 混淆矩阵
一个常见的起点是将实际类别和预测类别整理成一个称为混淆矩阵的表格,如下所示:
| | 实际类别:疾病存在 | 实际类别:疾病不存在 |
| — | — | — |
| 预测类别:疾病存在 | 4 TP | 5 FP |
| 预测
超级会员免费看
订阅专栏 解锁全文
3483

被折叠的 条评论
为什么被折叠?



