基于部首的混合统计 - 结构方法用于在线手写汉字识别
在当今数字化时代,随着数字化平板电脑、平板电脑、数字笔、基于笔的个人数字助理(PDA)和手机的出现,在线手写汉字识别(OLHCCR)再次引起了人们的关注。为了在计算和存储能力有限的手持设备上实现该技术,研究人员正致力于开发高精度、低复杂度的识别方法。
1. 在线手写汉字识别方法概述
在线手写汉字识别方法大致可分为统计方法和结构方法两类:
- 统计方法 :通常将整个字符形状表示为特征向量,并使用统计分类器进行分类。例如,方向特征密度或所谓的方向直方图特征,这种表示方式使得识别过程不受笔画顺序和笔画数量的影响。虽然统计方法能够取得较高的准确率,但由于汉字类别的数量庞大,导致其复杂度较高。
- 结构方法 :基于笔画分析和部首分析。为了容忍笔画顺序的变化,字符或部首通常被建模为关系图,以笔画或子笔画为基本元素。隐马尔可夫模型(HMM)经常被用于对笔画和部首进行建模,并且通过判别式训练可以降低基于HMM的部首识别错误。然而,由于HMM依赖于笔画顺序,对于笔画顺序变化的情况,每个部首/字符需要多个模型。
2. 部首识别方法的发展与挑战
部首识别方法受到汉字层次结构的启发,通过对数量较少的部首类别进行建模,而不是对字符进行建模,具有降低模型复杂度、提高识别准确率和减少训练样本数量等优点。然而,部首分割一直是一个挑战,之前的方法要么依赖于笔画顺序,要么容易受到笔画形状变化的影响。
3. 新的部首识别方法介绍
为了克服部首分割的困难,提出了一种新的基于部首的混合统计 - 结构方法,用
超级会员免费看
订阅专栏 解锁全文
958

被折叠的 条评论
为什么被折叠?



