在线流程图识别中句法知识的价值
1. 引言
在手写文档识别领域,尤其是处理诸如方案、规划、图表和流程图等复杂二维文档时,面临着诸多挑战。这些文档不仅包含文本,还涉及符号、形状和方框等元素,因此在进行手写识别之前,分割和结构分析步骤至关重要。而且,这类文档的二维特性使得书写顺序不固定,阅读和分析顺序需根据文档内容进行调整,例如流程图通常要沿着箭头方向进行阅读。
流程图识别的最终目标是对其内容进行语义分析。本文聚焦于对手写在线流程图的后验信号进行分析,具体任务包括为流程图的每个笔画标注标签,并根据符号对笔画进行分组。然而,这些任务面临两个主要挑战:一是文本笔画和符号笔画容易混淆,例如圆形笔画可能是字母“o”,也可能是圆形符号;二是大多数符号由多个笔画组成,且同一符号的笔画不一定连续书写。
目前,处理手写图表识别的方法存在局限性,尤其是在区分文本笔画和符号笔画方面。一些方法仅适用于纯符号图表,或要求用户明确指定书写类型(文本或符号),还有些方法对符号的笔画数量有要求。对于流程图,现有的方法主要基于统计方法,但这些方法因笔画信号不稳定而效果有限,因此引入结构知识有望提高识别效果。
2. 流程图的句法知识
2.1 现有符号
流程图用于描述算法或过程,由多种符号组成,如圆形、矩形等,箭头用于表示控制流,符号内部或箭头附近可能存在文本。常见的符号包括终止符、连接符、处理框、数据框、决策框、箭头和文本,具体如下:
|符号|形状描述|
| ---- | ---- |
|终止符和连接符|圆形,具体可为椭圆形或圆形|
|处理框、数据框和决策框|特定四边形,分别为矩形、平行四边形和菱形|
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



