基于图的KWS交叉评估
1. 引言
手写历史文档因其独特的书写风格和历史背景,常常面临诸如墨水渗透、褪色等质量问题,导致自动完整转录变得不可行。因此,关键词定位(KWS)作为一种灵活且容错性更高的替代方法被提出,允许在文档中检索任意查询的实例。KWS系统的核心是通过图匹配算法,将查询图与文档中的图进行匹配,以生成检索索引。
然而,现有的KWS系统通常针对每个文档单独优化参数,这在实际应用中并不理想,尤其是在面对大量不同手稿时。为了评估KWS系统的泛化能力,研究者在四个手写历史文档上进行了交叉评估实验,探讨了参数设置与书写风格之间的关系,并提出了一些集成策略,以提高系统的泛化能力。
2. 相关工作
基于图的KWS方法在过去几年中得到了广泛应用。通常,KWS系统通过将查询图与文档中的图进行匹配,使用排序后的图差异性来生成检索索引。不同的书写表示方法,如特征点、网格划分或投影剖面,被用于图的构建。常用的图不相似度度量包括二部图编辑距离(BP)和Hausdorff编辑距离(HED)。此外,集成方法也被提出,以结合不同的图表示方法,提高检索的准确性。
| 方法 | 描述 |
|---|---|
| 二部图编辑距离(BP) | 通过匹配图中的节点和边来计算编辑距离 |
| Hausdorff编辑距离(HED) | 计算图之间的最小编辑成本,适用于大规模图匹配 |
超级会员免费看
订阅专栏 解锁全文

2306

被折叠的 条评论
为什么被折叠?



