手写字符识别:神经网络技术与替代方法解析
1. 神经网络在手写字符识别中的应用
在手写字符识别领域,神经网络是一种强大的工具。有一种神经网络架构,其本质上接收原始输入图像。例如,Burges等人(1993)和LeCun等人(1989)描述的系统采用了这种方法,它在全连接的三层感知机之前添加了两个额外的层。为了减少自由参数的数量和训练时间,该网络的前两层使用共享或复制的权重。
这两个输入层可以看作是对输入图像与特定二维模式进行卷积操作(这些模式是使用反向传播算法自动学习得到的),然后对结果值进行非线性(即Sigmoid)变换。这种架构的前两层能够轻松执行类似于手工编码特征图的计算,代表方向导数的大小。然而,像“内部区域”检测这样的特征,虽然可以轻松手工编码,但使用五层感知机输入处的两个前馈感知机层从原始图像中可靠地计算出来却很困难。
2. 分类器组合方法
分类器组合是一种越来越重要的方法,它将多个神经网络和统计分类器的输出进行组合,通常能显著提高整体识别率。Perrone(1993)倡导使用分类器的线性组合,并将其应用于手写字符识别;类似的方法也在贝叶斯统计中得到应用(Berger 1985)。
堆叠分类或顺序分类器是指将几个第一阶段分类器的输出组合成一个单一的特征向量,并将其作为第二阶段分类器的输入(见Wolpert 1992),通常是一个神经网络(线性组合方法可以看作是一种特殊的堆叠,以一种感知机作为第二个分类器)。提升是一种比较和组合多个神经网络输出的技术,Drucker等人(1993,1994)对该技术在字符识别中的应用进行了描述。
以下是一些分类器组合的示例方法:
|方法|描述|
| --
超级会员免费看
订阅专栏 解锁全文
7353

被折叠的 条评论
为什么被折叠?



