历史手写文档中基于图的关键词检索
1. 引言
随着数字化手写文档数量的迅速增加,对这些文档的搜索和浏览却存在一定的可访问性不足。关键词检索(KWS)旨在从语音记录或文本图像中检索给定查询词的所有实例,可大致分为在线和离线KWS。本文聚焦于历史手写文档的离线KWS。
目前大多数KWS方法可分为基于模板和基于学习的匹配算法:
- 基于模板的KWS :早期基于像素逐像素匹配,后来发展为基于特征向量的动态时间规整(DTW)匹配以及局部二值模式(LBP)直方图匹配。其优点是独立于文档的表示形式和语言,但对不同书写风格的泛化能力较差。
- 基于学习的KWS :基于统计模型,如隐马尔可夫模型(HMM)、神经网络(NN)或支持向量机(SVM)。这些模型需要在大量训练词上进行先验训练,具有较高的泛化能力,但灵活性较差,因为需要在特定训练集上学习模型参数。
大多数KWS算法基于数值特征的统计表示,而图表示为KWS提供了更自然和全面的形式,不过目前基于图的KWS方法较少。本文提出了一种基于关键点检测的单个单词图表示新方法,与以往方法相比,每个单词用单个图表示,无需额外的图分配,且边缘检测和图匹配过程也有改进。
2. 图编辑距离
图 $g$ 正式定义为四元组 $g = (V, E, μ, ν)$,其中 $V$ 和 $E$ 是有限的节点和边集,$μ : V → L_V$ 和 $ν : E → L_E$ 分别是节点和边的标记函数。图可分为无向图和有向图,也可分为无标记图和有标记图。
图匹配方法可分为精确匹配和不精确匹配,图编辑距离(GED)是一种广泛
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



