手写数字识别:多种机器学习算法对比分析
1. 引言
手写数字识别在OCR和模式识别领域广为人知,可应用于邮政编码识别、银行支票处理、表单数据录入等场景。评判一个识别系统的指标通常包括识别准确率、耗时、内存等,特征提取和分类器选择对识别性能有很大影响。与在线手写数字识别相比,离线识别仍占主导地位。下面将介绍MNIST数据库以及多种用于手写数字识别的机器学习方法。
2. MNIST数据库
MNIST数据库通常由60,000张训练图像和10,000张测试图像组成,它是NIST更大数据集的一个子集。NIST的特殊数据库3(SD3)和特殊数据库1(SD1)共同构建了MNIST。在完整的样本集中,为使结果不受训练集和测试集选择的影响,会收集不同来源(SD3和SD1)的数据混合NIST数据库,其中训练图像和测试图像中SD3和SD1各占一半。实验表明,图像数量、计算机配置以及CPU运行状态等因素都会对性能产生很大影响。
3. 机器学习方法
以下是10种用于手写数字识别的机器学习方法:
- CNN(卷积神经网络) :传统的CNN由输入层、卷积层、池化/下采样层和全连接层组成。卷积层检测前一层特征的局部组合,池化层将语义相似的特征合并为一个。与其他深度架构的主要区别在于,CNN设计为使用最少的预处理。基于CNN的推理存在大量卷积运算和大内存需求这两个常见瓶颈。在CPU环境中,CNN的准确率最高可达99%,但训练耗时约7389秒。测试在Matlab深度学习工具箱中进行,使用60000张图片进行训练,10000张图片进行测试,每张图片大小为28 * 28。CNN层包括输入层、2个卷积层、2个子采样层,alph
超级会员免费看
订阅专栏 解锁全文
2363

被折叠的 条评论
为什么被折叠?



