分类器评估指标与实现
1. 引言
在机器学习中,评估分类器的性能是非常重要的。不同的评估指标可以从不同的角度衡量分类器的表现,帮助我们选择最合适的分类器。本文将介绍一些常见的分类器评估指标,包括真阳性率、假阳性率、准确率等,并展示如何使用Scikit-learn库来实现这些指标的计算。
2. 分类器评估基础
2.1 训练集与分类器
假设我们有一个训练集,用于训练一个二元分类器 $\psi$。这个分类器将随机特征向量 $X$ 的实现映射到类别变量 $Y$ 的实现,$Y$ 有两个取值:“P”(正类)和 “N”(负类)。一般来说,我们会将 “非典型” 的标签标记为正类,“典型” 的标签标记为负类。
2.2 分类过程
分类过程有一个中间步骤。对于特征向量 $X$ 的一个实现 $x$,首先将其映射到一个分数 $s(x)$,这个分数可以是观察值到决策超平面的距离,或者是一个实例属于特定类别的估计概率。然后将这个分数与一个阈值 $t$ 进行比较,如果 $s(x) > t$,则将 $x$ 分配到正类 $P$,否则分配到负类 $N$。形式上可以表示为:
[
\psi(x) =
\begin{cases}
P & \text{if } s(x) > t \
N & \text{otherwise}
\end{cases}
]
2.3 分类结果分类
将训练好的分类器 $\psi$ 应用于一个大小为 $m$ 的样本 $S_{te,m} = {(x_1, y_1), (x_2, y_2), \l
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



