基于平均精度损失的序列标注结构支持向量机及手写文档作者鉴定方法
在计算机视觉和机器学习领域,平均精度(AP)已成为评估模型在多操作点性能的重要指标。然而,传统的序列标注算法,如维特比算法,无法直接计算平均精度。同时,在法医科学中,确定手写文档的作者身份是一项具有挑战性的任务,传统方法存在主观性强和计算模型复杂度高的问题。本文将介绍一种基于平均精度损失的序列标注结构支持向量机方法,以及一种利用纹理描述符的手写文档作者鉴定优化方法。
平均精度与相关概念
平均精度的计算涉及到精度(p@r)和召回率(r)的概念。精度是指在召回率为 r 时的准确率,其计算公式为:
[p@r = \frac{TP}{TP + FP}]
其中,TP 是真正例的数量,FP 是假正例的数量,且需满足:
[\frac{TP}{TP + FN} = r]
FN 是假反例的数量,这些值可从预测标签和真实标签的分类列联表中计算得出。一般来说,精度会随着召回率的增加而降低,但它不是召回率的单调非增函数。为确保求和项的单调性,Everingham 等人对平均精度的定义进行了修改:
[AP = \frac{1}{R} \sum_{r} \max_{l=0…r} p@l]
这种计算平均精度的方法在计算机视觉和机器学习社区中已很常见,并且在本文的实验中被采用。由于平均精度介于 0 和 1 之间,基于平均精度的损失可定义为 (\Delta AP = 1 - AP)。
序列标注
序列标注的任务是根据给定的测量序列 (x = (x_1, \cdots, x_t, \cdots, x_T)) 预测一系列的类别标签 (y = (y_1, \cdots, y_
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



