基于平均精度损失的序列标记结构支持向量机及笔迹法医分析
平均精度相关概念及公式
平均精度(AP)是评估模型性能的重要指标,在计算机视觉和机器学习领域应用广泛。在给定召回率水平 $r$ 下,精度 $p@r$ 的计算公式为:
[p@r = \frac{TP}{TP + FP}]
其中,$TP$、$FP$ 和 $FN$ 分别是真正例、假正例和假反例的数量,且需满足 (\frac{TP}{TP + FN} = r)。召回率范围通常在 0 到 1 之间,以 0.1 为步长。一般来说,精度会随着召回率 $r$ 的增加而降低,但并非单调递减函数。为保证求和项的单调性,对 AP 的定义进行了修改:
[AP = \frac{1}{R} \sum_{r} \max_{l=0…r} p@l]
由于 AP 的取值范围在 0 到 1 之间,基于 AP 的损失定义为 (\Delta AP = 1 - AP)。
序列标记
序列标记是根据给定的测量序列 (x = (x_1, \cdots, x_t, \cdots, x_T)) 预测一系列分类标签 (y = (y_1, \cdots, y_t, \cdots, y_T)) 的过程。其中,(x_t) 是序列位置 (t) 的特征向量,(y_t) 是对应的离散标签。在很多情况下,可假设 (y_t) 为二进制标签(1 表示正类,0 表示负类),通过组合多个二分类器实现多分类。
最常用的序列标记模型是隐马尔可夫模型(HMM),它是一种概率图模型,将标签和测量值的联合概率进行分解。通过将模型限制在指数族分布,并在对数尺度上表示概率,HMM 的得分可以表示为广义线性模型:
[\ln p(x,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



