基于IFN/ENIT数据库的阿拉伯文手写单词识别
1. 引言
自动识别手写单词仍是一项具有挑战性的任务,尤其是阿拉伯文手写文本的自动识别,还有很多工作要做。离线识别系统针对扫描的手写单词图像,而在线识别系统则是识别在设备上书写的坐标流。本研究聚焦于离线单词识别。
开发和比较识别系统的关键是拥有包含真实标注信息的大型数据库。IFN/ENIT数据库是首个可用于大学研究的阿拉伯文手写名称图像数据集,被广泛应用于阿拉伯文单词识别系统的开发,还用于2005 - 2011年国际文档分析与识别会议(ICDAR)组织的竞赛。
由于连笔书写使单词中的字符相连,难以将印刷文字的识别方法直接应用于手写文字。基于隐马尔可夫模型(HMM)的方法是解决字符连接问题的有效途径,该方法在语音识别中取得了成功,近年来也被应用于手写文字识别。了解所用字符集和不同书写风格对于开发识别系统、预处理和特征提取至关重要。阿拉伯字符与拉丁字符形状不同,因此特定字符和语言的处理模块非常重要,预处理、归一化、HMM识别器以及使用语言相关语法和语义的后处理都需适应阿拉伯文书写风格。
2. 阿拉伯文字符的特点
阿拉伯文从右向左书写,印刷和手写版本中单词内的字符通常连接在基线上,但有六个字符除外。若单词中出现这些字符,单词会被分割成多个部分(PAW)。阿拉伯文使用28个不区分大小写的字符,字符形状取决于其在单词中的位置,孤立字符的形状可能与在单词开头、中间或结尾的同一字符不同。此外,字符还可能带有一到三个点或变音符号。
3. 识别系统概述
单词识别系统的在线部分流程如下:
- 将纸质文档转换为数字形式,通常是灰度或彩色图像数据。
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



