基于卷积神经网络的曼尼普尔手写字符识别
手写字符识别是模式识别领域的重要研究方向,在银行、邮政自动化、表格填写等众多应用场景中具有巨大潜力。然而,由于同一字符书写风格多样,以及存在视觉上相似的特征,开发这样的识别系统极具挑战性。本文提出了一种基于深度神经网络的识别系统,并在一个由90位不同年龄和教育背景的人提供的曼尼普尔手写字符数据集上进行了性能测试,该数据集包含4900个样本图像,实验取得了98.86%的识别率。
1. 引言
近年来,卷积神经网络(CNN)在大规模图像和视频处理领域取得了巨大成功。图像分类是计算机视觉的核心问题之一,它根据图像的视觉内容为未知图像分配固定类别标签。手写字符识别作为一个关键领域,应用范围广泛,涵盖邮政编码识别、作者识别、交通车牌数字和字母识别以及银行支票处理等。
但设计手写字符识别架构对研究人员来说充满挑战,因为无约束手写字符或单词的自然属性存在诸多问题。同一字符的形状可能因书写者而异,有的书写结构较大,有的则较小,导致字符墨水痕迹的重叠区域可能很小。此外,采集设备、笔宽和墨水颜色也会影响书写风格。曼尼普尔手写字符由于其结构和形状复杂,包含大量曲线、环形和其他细节,且存在许多形状相似的字符对,因此更需要高效的识别系统来解决这些问题。
通常,识别算法会在已知字符的数据集上进行训练,为每个字符分配标签,以准确识别测试集中的字符。本文提出了一种用于手写梅泰文(曼尼普尔语)字符识别的深度学习方法。曼尼普尔语是印度曼尼普尔邦的官方语言,梅泰文是其文字。作为一种地区性语言,对该文字的研究仍处于早期阶段。因此,本文研究了一种基于卷积神经网络的方法,该网络包含六个卷积层和两个最大池化层(每三个卷积层应用一次最大池化层以缩小图像体积)。每个卷积层的滤波器
超级会员免费看
订阅专栏 解锁全文
726

被折叠的 条评论
为什么被折叠?



