自动行方向测量在可疑文件检验中的应用
1. 背景与问题提出
在可疑文件检验领域,存在众多问题,如文件可能被伪造、篡改,签名可能被仿冒等。专家在手动识别这些伪造情况时,会将行方向作为一个特征。然而,人工检测不仅繁琐,而且对于一些细微的行方向差异可能难以察觉。
在合同场景中,一方可能会在已签署的合同上添加内容,比如打印额外的行,或者粘贴打印好的行到现有文档部分,再进行复印以获得看似原始的文档。即便伪造手段高明,行方向仍可能存在细微差异,这些差异往往难以用肉眼识别。
2. 方法概述
为了更快速地检测这些差异,提出了一种自动检测打印文本中未对齐行的方法。该方法采用可训练且基于统计的方式,具体步骤如下:
1. 建立模型 :使用正态分布对行的旋转角度进行建模。对于给定的一组训练图像,提取文本行及其对应的旋转角度,计算每页的平均旋转角度,将每页文本行的旋转角度减去该平均值,以实现均值 $\mu_{\theta} = 0$ 的正态分布,然后使用最大似然估计计算标准差 $\sigma_{\theta}$。
2. 检验文档 :使用第一步获得的参数来评估可疑文档中文本行的对齐情况。以与训练相同的方式提取文本行,将获得的行旋转角度分布平移以获得均值为 0 的分布,检查每个行角度是否在 68%、95% 或 99.7% 的置信区间内,最后通过对线条进行相应着色将此信息添加到图像中,以获得结果的图形表示。
以下是该方法的流程 mermaid 图:
graph TD
A[训练阶段]
超级会员免费看
订阅专栏 解锁全文
5232

被折叠的 条评论
为什么被折叠?



