基于部首的在线手写汉字识别框架解析
1. 基于部首的识别框架概述
基于部首的识别框架整合了特殊部首检测和基于嵌套分割的非特殊结构识别。输入的字符模式是一系列笔画,每个笔画由 (x, y) 坐标序列表示。
在特殊部首检测阶段,使用特定的启发式规则(几何规则)对笔画进行分组,生成候选部首,然后通过特殊部首检测器(二元分类器)对候选部首进行分类。如果所有候选部首都被拒绝,则将字符视为非特殊结构,使用基于嵌套分割的通用部首模型进行识别;如果有多个候选部首被接受,则保留相似度最高的一个。
提取特殊部首后,字符的剩余部分被假定为 SE/LR/UD 结构,使用嵌套的水平/垂直分割方法进行识别。如果不同的检测器检测到多个特殊部首,则分别从输入字符中提取每个部首,并通过相应的非特殊结构模块识别剩余部分。最后,将特殊部首检测结果和剩余部分的识别结果融合,得到整个字符的识别结果。
为了进一步提高识别准确率,还引入了三种策略。以下是该框架的流程图:
graph TD;
A[输入字符模式] --> B[特殊部首检测];
B --> C{是否有候选部首被接受};
C -- 否 --> D[非特殊结构识别];
C -- 是 --> E[提取特殊部首];
E --> F[剩余部分识别];
F --> G[结果融合];
D --> G;
2. 特殊部首检测
特殊部首检测模块的目的是检测输入字符是否包含特殊部首,其检测性能决定了整体识别的准确率。
超级会员免费看
订阅专栏 解锁全文
38

被折叠的 条评论
为什么被折叠?



