分类器校准与分类器系统详解
1. 分类器校准
1.1 逻辑校准
逻辑校准是一种将分类器得分转换为概率的方法,其核心公式如下:
[
\begin{align }
LR(x) &= exp(\pm(w \cdot x - t_0))\
&= exp(\pm(s(x) - (t_0 - t)))\
\pm &= w \cdot (\mu_C - \mu_-)/\sigma^2\
t_0 &= w \cdot (\mu_C + \mu_-)/2
\end{align }
]
其中,(\mu_C) 和 (\mu_-) 是类别均值。将其代入公式并简化(假设 (a = 1))可得:
[
p(x) = \frac{1}{1 + exp(-\pm(w \cdot x - t_0))} = \frac{1}{1 + exp(-\pm(s(x) - (t_0 - t)))}
]
这定义了一个逻辑曲线,中点为 (s = t_0 - t),中点处的斜率为 (\pm)。位置参数 (t_0 - t) 移动决策边界,使其将连接两个类别均值的线从中点切断;形状参数 (\pm) 量化了两个类别的分离程度。这种方法也被称为 Platt 缩放,这里称为逻辑校准。
1.2 等渗校准与逻辑校准效果对比
在一个示例中,等渗校准的分类器比未校准的分类器具有更高的 AUC(0.88 而非 0.80)和更低的 Brier 分数(0.1333 而非 0.1885)。逻辑校准由于其模型假设(每个类别得分呈正态分布)在小样本上未
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



