用于阿拉伯文手写识别的多流马尔可夫模型
1 引言
阿拉伯语是世界上使用第二广泛的字母系统,仅次于拉丁字母。然而,阿拉伯文手写识别系统的研究相对较少。近年来,随着新数据库的开发和国际竞赛的举办,阿拉伯文手写识别受到了更多关注。
阿拉伯文字母有 28 个基本字母,无大小写之分,字符形状依赖于其在单词中的位置,还有“变音符号”等。此外,一些字母组合有特殊形状“连字”,这使得阿拉伯文字符形状多达 170 种,远多于拉丁字母的 52 种。阿拉伯语单词还会被分割成阿拉伯语单词部分(PAWs)。
虽然阿拉伯语和拉丁语字母有所不同,但都是字母文字,这使得基于字符模型构建识别系统成为可能。随机模型,特别是隐马尔可夫模型(HMMs),近年来在阿拉伯文手写识别中得到广泛应用。多流 HMMs 方法由异步组合多个信息源组成,使用协作马尔可夫模型。下面将介绍多流识别系统的架构及其优化实现。
2 信息组合策略
信息组合是手写识别中常用的技术,可提高分类率。常见的组合策略分为两类:特征融合方法和决策融合技术。
- 特征融合方法(早期集成) :将输入特征集连接成一个大的特征空间,然后使用传统的 HMM 分类器对组合后的观测值进行建模。
- 决策融合技术(晚期集成) :组合多个分类器的输出(决策)。不同的特征表示先由单个 HMM 分类器分别建模和解码,然后将解码输出组合得到最终文本输出。
研究表明,两种组合方法都能提高识别性能,且在某些情况下,早期集成方法优于决策级组合。多流隐马尔可夫模型是决策融合框架中的一种特殊方法,在自动语音识别领域有较多研究,它能在子
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



