密集对应与古代文本的转录对齐技术探索
在处理古代文本图像时,转录对齐是一项关键任务,它有助于准确解读和分析这些珍贵的历史资料。本文将介绍一种基于密集对应关系的转录对齐方法,该方法在处理不同字体、语言和书写特征的文本图像时展现出了良好的效果。
FPLBP特征表示的优势
在图像特征表示方面,传统的一些方法如TPLBP和LBP存在一定的局限性。这些方法在处理小块图像时,对噪声更为敏感,这在处理退化的手稿图像时是一个主要问题。
相比之下,FPLBP具有几个吸引人的特性,使其非常适合当前的任务:
1. 尺寸小 :FPLBP的表示尺寸明显小于其他方法。在密集网格上提取描述符时,这一特性尤为重要,因为其他表示方法可能需要大量的存储和处理时间,而FPLBP则能有效避免这些问题。
2. 高效捕捉信息 :对于文档图像,TPLBP(以及LBP)产生的代码范围在实际计算中只能部分体现。这是因为文档图像的特性更为受限,导致局部模式变化较小。因此,FPLBP通过比较左右、上下和两条对角线上的局部外观,就足以捕捉有意义的信息。
通过实验对比TPLBP和FPLBP计算的代码值的变异性,可以验证上述观察。TPLBP的直方图比FPLBP的直方图稀疏得多,这表明FPLBP能够更有效地利用不同的值来捕捉外观变化。
从代码到密集描述符的转换
手稿图像和参考图像分别转换为代码图像C和C0后,需要将这些代码转换为密集的、逐像素的表示。具体步骤如下:
1. 考虑局部位移 :为了考虑像素代码的局部位移,每个像素由其紧邻邻域内
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



