17、在线流程图识别中句法知识的价值

在线流程图识别中句法知识的价值

1. 引言

在手写文档识别领域,尤其是处理诸如方案、规划、图表和流程图等复杂二维文档时,面临着诸多挑战。这些文档不仅包含文本,还涉及符号、形状和方框等元素,因此在进行手写识别之前,分割和结构分析步骤至关重要。而且,这类文档的二维特性使得书写顺序不固定,阅读和分析顺序需根据文档内容进行调整,例如流程图通常要沿着箭头方向进行阅读。

流程图识别的最终目标是对其内容进行语义分析。本文聚焦于对手写在线流程图的后验信号进行分析,具体任务包括为流程图的每个笔画标注标签,并根据符号对笔画进行分组。然而,这些任务面临两个主要挑战:一是文本笔画和符号笔画容易混淆,例如圆形笔画可能是字母“o”,也可能是圆形符号;二是大多数符号由多个笔画组成,且同一符号的笔画不一定连续书写。

目前,处理手写图表识别的方法存在局限性,尤其是在区分文本笔画和符号笔画方面。一些方法仅适用于纯符号图表,或要求用户明确指定书写类型(文本或符号),还有些方法对符号的笔画数量有要求。对于流程图,现有的方法主要基于统计方法,但这些方法因笔画信号不稳定而效果有限,因此引入结构知识有望提高识别效果。

2. 流程图的句法知识
2.1 现有符号

流程图用于描述算法或过程,由多种符号组成,如圆形、矩形等,箭头用于表示控制流,符号内部或箭头附近可能存在文本。常见的符号包括终止符、连接符、处理框、数据框、决策框、箭头和文本,具体如下:
|符号|形状描述|
| ---- | ---- |
|终止符和连接符|圆形,具体可为椭圆形或圆形|
|处理框、数据框和决策框|特定四边形,分别为矩形、平行四边形和菱形|

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值