基于隐马尔可夫模型的在线阿拉伯手写文字识别
1. 引言
在线阿拉伯手写文字识别在处理手写文字时面临诸多挑战,如书写风格的多样性、延迟笔画的存在等。为了有效解决这些问题,我们采用了隐马尔可夫模型(HMM),结合强大的在线和离线特征提取方法,实现了高效准确的识别系统。
2. 预处理
2.1 平滑和重采样
平滑处理旨在消除因书写不规则和采集设备缺陷导致的轮廓锯齿。对于轨迹上的每个点 (P_t(x(t),y(t))),根据以下公式进行替换:
[
P_t = \sum_{k=-n}^{n} \alpha_k P_{t+k}, \quad \sum_{k=-n}^{n} \alpha_k = 1
]
其中,(\alpha_k = (2n + 1)^{-1}),使得每个点的坐标为自身及其 (2n) 个邻点的均值。
重采样算法基于轨迹分割方法,重新分布数据点,使笔画上的点间距均匀。实验表明,重采样距离应与每个字符 HMM 的状态数以及每个 HMM 帧中的点数成反比。
2.2 基线检测
基线检测是预处理的重要环节,它依赖于测试单词的全局基线。我们采用水平投影方法,具体步骤如下:
1. 通过插值每个笔画构建离线有界图像。
2. 移除一些易于检测的延迟笔画,这些笔画面积小且书写方向固定。
3. 在任意基线下方狭窄区域(20%)内搜索直方图,寻找高于最大投影值 80% 的值。
4. 若存在该值,则将此垂直位置选为任意基线,解决某些阿拉伯字母在直方图中产生峰值的问题。
5. 将每个像素垂直厚度增加到 5 像素,提高 PAWs
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



