历史阿拉伯手稿的鲁棒单词定位系统
1. 引言
单词定位(WS)是检索和理解历史文档的基本工具之一。在传统基于识别的方法失效的情况下,这种快速方法表现出了良好的性能。然而,历史文档通常存在各种退化问题,如墨水褪色、干扰图案以及纤维素结构损坏等,而且书写风格复杂,行间距小、单词可能重叠,因此历史文档的 WS 技术必须具备鲁棒性和适应性。
在文档分析和理解中,有两个重要概念:性能和能力。性能衡量的是书写与标准模式的差异程度,而能力则取决于作者的知识。成功分析和理解历史手稿图像的方法应接受能力差异并允许足够的变化空间。
目前,WS 通常基于将图形查询与目标文档中的可能候选对象进行匹配。直接匹配方法计算成本高,且对笔画宽度和风格变化敏感。一些基于区域、特征的方法也各有优缺点,如基于梯度特征的方法对空间偏移敏感,基于生物问题的方法需要大量特征和单词分割数据等。
2. 问题陈述
现有手写阿拉伯手稿的文档图像,假设文档只有一个作者,且由于书写风格,行和单词分割困难甚至不可能。目标是在不音译文本的情况下,在文档图像中搜索和索引少量单词。
3. 基于骨架的无分割单词定位方法
为解决该问题,对输入文档图像的子单词或连通组件(CCs)进行基于形状的分析,然后通过将查询单词的形状与文档 CCs 的形状进行快速实时比较来定位查询单词。该方法分为两个步骤:数据准备和定位过程。
4. 数据准备
4.1 预处理和先验信息
历史文档的增强是分析和理解的关键步骤。使用多级分类器去除背景、恢复干扰图案并保留弱笔画和连接。
具体操作步骤如下:
基于骨架的阿拉伯手稿单词定位
超级会员免费看
订阅专栏 解锁全文
11

被折叠的 条评论
为什么被折叠?



