手写文档作者检索中梯度和纹理特征的比较
在过去几年里,为了实际生活中的诸多用途,如身份验证和银行支票读取,开发了大量的手写分析系统。这些系统通常基于对手写签名、单词或数字的识别。近年来,该领域又涌现出了新的应用,例如,处理大量数字化手写文档的导航和索引工具的需求,推动了单词识别和作者检索技术的应用。
作者检索旨在找出属于同一作者的所有文档,即便这些文档是在不同时间、用不同语言书写,且文本内容各异。该检索过程无需事先了解作者身份,系统会尝试挑选出与查询文档具有相同书写特征的所有文档。传统的作者检索系统由特征生成和匹配两个步骤组成。
1. 文献综述
作者检索是手写识别领域在2011年引入的新话题,相关研究较少,且常与作者识别相互关联。由于检索步骤是通过基于距离的匹配来完成的,其性能主要由特征生成步骤控制。因此,目前的研究主要集中在寻找用于表征手写文档的鲁棒特征。大致来说,已经有多种特征被用于作者检索,包括统计特征、拓扑特征和可训练特征等。
不同的研究采用了不同的特征和匹配方法,例如:
- Atanasiu等人利用手写轮廓的局部方向生成有区分性的手写特征,检索步骤基于欧几里得距离,实验表明方向概率密度函数的主要模式表现最佳。
- Shirdhonkar等人提出使用轮廓波变换结合堪培拉距离,但结果显示全局变换的表征效果不佳。
- Fiel和Sablatnig引入了尺度不变特征变换(SIFT)作为局部文档特征,采用卡方距离进行匹配,在IAM数据集上的检索准确率达到了97.2%(TOP - 2)。
- 还有研究比较了多种特征,如轮廓方向、边缘方向、游程长度和局部微观结构特征等,发现微观结构特征在TOP - 2时的检索得分约为96.8
超级会员免费看
订阅专栏 解锁全文
1478

被折叠的 条评论
为什么被折叠?



