阿拉伯手写数学表达式中空间关系的识别
1. 阿拉伯手写数学表达式自动识别概述
阿拉伯手写数学表达式的自动识别包括两个步骤:一是数学符号识别,二是数学表达式的结构分析。在阿拉伯符号表示中,根据地区不同会使用两种数字系统,即阿拉伯数字(9, 8, 7, 6, 5, 4, 3, 2, 1, 0)或阿拉伯 - 印度数字。符号之间的空间关系承载了数学符号表示的大部分含义,尽管数学符号表示相对标准,但符号的相对排列仍允许有显著变化,这使得表达式中符号之间重要空间关系的识别和定义具有模糊性。对于识别隐式数学运算符,空间关系至关重要,隐式运算符通过操作数的空间排列来表示,而非显式运算符。
2. 相关工作
数学表达式具有二维结构,其识别涉及符号识别和结构分析两个步骤。与手写拉丁数学识别系统经过多年广泛研究和开发不同,阿拉伯数学公式的识别系统非常罕见。在空间关系分类方面,大多数方法使用手工规则,且仅基于子表达式或符号的边界框提取的信息。例如,Zhang 等人确定每个符号周围的区域,并根据第二个符号的位置区域识别表达式中每个符号与第二个符号之间的关系;Okamoto 等人确定了升序和降序符号边界框的修改中心;Aly 等人也提出了类似方法来区分相邻对之间的结构关系;Álvaro 等人使用几何特征和形状上下文特征确定手写符号/子数学表达式之间的结构关系,并使用支持向量机(SVM)分类器进行识别;Simistira 等人从子表达式的边界框中提取几何特征,并在分类阶段比较了 SVM 和人工神经网络(ANN)。
3. 数学表达式表示
数学表达式是由多个部分(符号)组成的结构化数据,信息不仅包含在符号标签中,还包含在这些部分的排列(空间关系)中。与传统的监督学习(如
超级会员免费看
订阅专栏 解锁全文
2049

被折叠的 条评论
为什么被折叠?



