在线手写汉字识别与多模态生物识别系统的研究进展
在线手写汉字识别
在在线手写汉字识别领域,提出了一种基于部首的混合统计 - 结构方法。为便于部首分割和部首模型学习,精心挑选了部首类别。对于非特殊部首,通过自动部首分割和聚类从训练字符样本中学习其模型;而特殊部首则由二元分类器进行检测,每个特殊部首类别对应一个分类器。
在非特殊结构(左右、上下、包围)汉字识别方面,采用了顺序和层次两种方案进行字符 - 部首字典表示,并相应地使用了束搜索和嵌套动态规划两种搜索方法。同时,还提出了一个集成框架,将特殊部首检测器、非特殊和特殊结构识别模块相结合,以实现任意结构的整字识别。
实验结果显示,非特殊和特殊结构识别的独立模块与基于多变量二次判别函数(MQDF)的整体字符识别表现相当。具体来看,502 类别的识别准确率达到了 97.43%,这再次表明基于部首的识别能够取得与整体识别相近的字符识别准确率。在特殊结构字符的测试中,不同的特殊部首检测器和搜索方法组合呈现出不同的准确率,如下表所示:
| 特殊部首检测器 | 搜索方法 | 准确率 (%) |
|---|---|---|
| SVM - poly | Beam | 97.83 |
| SVM - poly | DP | 97.53 |
| SVM - rbf |
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



