支持向量机在手写识别中的应用
1. 手写识别概述
自动化手写识别(HWR)在离线和在线感知任务中越来越受欢迎。随着对节能计算的重视,开发强大且计算高效的算法仍然是一个具有挑战性的问题。离线识别是通过光学扫描文字,然后将这些图像转换为计算机软件环境中可用的字母代码;在线识别则是自动将图形输入板或基于笔的计算机屏幕上的书写内容转换为字母代码。HWR系统还可以分为依赖书写者和不依赖书写者两类,依赖书写者的系统由于提供的数据方差较小,识别率更高。
由于孤立字母的HWR是在线HWR的重要步骤,这里介绍一个开发高效的不依赖书写者的孤立字母HWR系统的案例研究,使用笔轨迹建模进行特征提取,并使用多类支持向量机(MSVM)进行分类。该案例不仅强调了应用的重要性,还展示了如何从顺序数据中创建静态特征,以及如何将多类任务转换为分层任务。通常,隐马尔可夫模型(HMM)更适合对顺序数据进行建模和识别,但通过适当的特征生成方案,SVM模型可以用于对中等手写词汇的可变序列长度进行建模。
2. 手写识别工作流程
该HWR工作流程包括预处理、特征提取和分层的三阶段分类。
2.1 预处理
UJIpenchars数据库可以转换为适合特征提取的点序列,这与许多HWR系统中常见的预处理步骤类似。预处理包括校正倾斜、归一化字母尺寸以及相对于质心移动坐标。
具体步骤如下:
1. 校正倾斜 :将输入的一系列收集点首先表示为极坐标向量,然后只考虑与垂直方向夹角等于或小于50度的向量。通过对这些有效向量的角度求平均值来计算倾斜度。
2. 旋转字母
超级会员免费看
订阅专栏 解锁全文
24万+

被折叠的 条评论
为什么被折叠?



