手写文档作者检索中梯度和纹理特征的比较
1. 引言
在过去几年里,众多手写分析系统被开发用于实际生活,如身份验证和银行支票读取等。这些系统通常基于手写签名、单词或数字的识别。近年来,该领域出现了新的应用,如对大量数字化手写文档进行导航和索引的需求,推动了单词定位和作者检索技术的发展。
作者检索旨在找出同一作者所写的所有文档,无论书写时间、语言以及文本内容如何,且无需事先了解作者身份。传统的作者检索系统由特征生成和匹配两个步骤组成,如下图所示:
graph LR
A[特征生成] --> B[匹配步骤]
B --> C[检索结果]
为了生成特征,可以使用用于手写识别的各种描述符,如梯度特征、纹理特征和拓扑特征。匹配步骤通过简单的相异度度量来完成。为了提高检索分数,研究人员致力于开发更鲁棒的特征。
本文将研究不同特征生成方案在作者检索中的性能。具体来说,使用局部二值模式(LBP)和旋转不变LBP进行纹理特征描述,使用方向梯度直方图(HOG)和梯度LBP(GLBP)作为梯度特征,像素密度和游程长度特征(RLF)作为拓扑特征。为了实现检索阶段,将使用各种相似性和相异度度量。实验将在ICDAR - 2011作者识别数据集的两个版本上进行。
2. 文献综述
作者检索是手写识别领域在2011年引入的新主题,相关研究较少,且常与作者识别重叠。由于检索步骤通过基于距离的匹配来执行,其性能主要由特征生成步骤控制。因此,现有研究致力于寻找用于表征手写文档的鲁棒特征。
以下是一些相关研究工作的总
超级会员免费看
订阅专栏 解锁全文
1478

被折叠的 条评论
为什么被折叠?



