17、在线流程图识别中句法知识的价值

keras9composer

于 2025-10-31 11:42:17 发布

阅读量9

点赞数

CC 4.0 BY-SA版权

分类专栏：图形识别前沿探秘文章标签：在线流程图识别句法知识结构分析

本文链接：https://blog.youkuaiyun.com/keras9composer/article/details/154934670

图形识别前沿探秘专栏收录该内容

34 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

在线流程图识别中句法知识的价值

1. 引言

在手写文档识别领域，尤其是处理诸如方案、规划、图表和流程图等复杂二维文档时，面临着诸多挑战。这些文档不仅包含文本，还涉及符号、形状和方框等元素，因此在进行手写识别之前，分割和结构分析步骤至关重要。而且，这类文档的二维特性使得书写顺序不固定，阅读和分析顺序需根据文档内容进行调整，例如流程图通常要沿着箭头方向进行阅读。

流程图识别的最终目标是对其内容进行语义分析。本文聚焦于对手写在线流程图的后验信号进行分析，具体任务包括为流程图的每个笔画标注标签，并根据符号对笔画进行分组。然而，这些任务面临两个主要挑战：一是文本笔画和符号笔画容易混淆，例如圆形笔画可能是字母“o”，也可能是圆形符号；二是大多数符号由多个笔画组成，且同一符号的笔画不一定连续书写。

目前，处理手写图表识别的方法存在局限性，尤其是在区分文本笔画和符号笔画方面。一些方法仅适用于纯符号图表，或要求用户明确指定书写类型（文本或符号），还有些方法对符号的笔画数量有要求。对于流程图，现有的方法主要基于统计方法，但这些方法因笔画信号不稳定而效果有限，因此引入结构知识有望提高识别效果。

2. 流程图的句法知识

2.1 现有符号

流程图用于描述算法或过程，由多种符号组成，如圆形、矩形等，箭头用于表示控制流，符号内部或箭头附近可能存在文本。常见的符号包括终止符、连接符、处理框、数据框、决策框、箭头和文本，具体如下：
|符号|形状描述|
| ---- | ---- |
|终止符和连接符|圆形，具体可为椭圆形或圆形|
|处理框、数据框和决策框|特定四边形，分别为矩形、平行四边形和菱形|