22、基于深度卷积神经网络的手写字符识别

基于深度卷积神经网络的手写字符识别

1. 引言

光学字符识别是将图像中的文本提取并转换为数字化文本格式的过程。图像中的文本数据通常可分为印刷文本和手写文本两类。虽然在印刷字符识别方面已经有很多工作,像Tesseract这样的开源系统,但这些系统不太适合通用的文本提取,在处理手写文本时效果不佳。

手写字符识别(HCR)是一个更具挑战性的问题,因为手写文本的变化性很大。HCR系统在产生大量手写文档的行业有广泛应用,例如银行支票的自动处理、医疗保健中读取患者表格以及大学读取成绩等。

HCR可分为在线和离线两种方式。在线HCR是在书写过程中自动处理信息,而离线HCR处理扫描图像中的文本。以往手写字符分类方法常采用手工特征提取方法,但这些手动提取的特征受用户先验知识的限制,导致分类器输入质量下降,结果不理想。

深度学习(DL)是一类快速发展的机器学习算法,它使用多个非线性隐藏层,能够从原始数据中直接提取特征,捕捉输入中的复杂关系。像卷积神经网络(CNNs)这样的深度学习方法提取的特征优于手工设计的特征,且比传统的多层感知器(MLP)等神经网络模型表现更好。随着处理器和图形处理单元(GPUs)处理能力的提升,训练与这些深度网络相关的大量参数成为可能,也催生了多个深度学习框架,如Google在2015年发布的TensorFlow,以及基于它构建的高级库Keras,使用Keras编写原生TensorFlow代码更方便。因此,这里提出了一个使用Keras的深度卷积神经网络模型,用于手写字符识别,且预处理极少。

2. 相关工作

最早使用CNN进行字符识别的工作之一可能是Yann LeCun等人在1998年提出的LeNet。他们发现专门处

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值