MNIST手写数字识别模型精度测试

最新推荐文章于 2025-05-30 08:00:00 发布

AI-CS研究生

最新推荐文章于 2025-05-30 08:00:00 发布

阅读量1.6k

点赞数

CC 4.0 BY-SA版权

分类专栏：人工智能计算机科学与技术 AI 卷积神经网络研究生文章标签： AI 人工智能神经网络

本文链接：https://blog.youkuaiyun.com/weixin_42414405/article/details/91468346

本文探讨了使用MNIST数据集训练手写数字识别模型的过程，包括前向传播和反向传播的实现。通过对比实验，研究了不同学习率、优化算法（如SGD与ADAM）对模型精度的影响。实验发现，适当提高学习率能提升模型精度，而ADAM算法在更低学习率下表现出更快的收敛速度和更好的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MINST数据库是由Yann提供的手写数字数据库文件，其官方下载地址http://yann.lecun.com/exdb/mnist/

数据库的里的图像都是28*28大小的灰度图像，每个像素的是一个八位字节（0~255）

这个数据库主要包含了60000张的训练图像和10000张的测试图像，主要是下面的四个文件

其中：

　　训练集（包括５０００的验证集）：

　　　　Training set images: train-images-idx3-ubyte.gz (9.9 MB, 解压后 47 MB, 包含 60,000 个样本)
　　　　Training set labels: train-labels-idx1-ubyte.gz (29 KB, 解压后 60 KB, 包含 60,000 个标签)

　　测试集：

　　　　Test set images: t10k-images-idx3-ubyte.gz (1.6 MB, 解压后 7.8 MB, 包含 10,000 个样本)
　　　　Test set labels: t10k-labels-idx1-ubyte.gz (5KB, 解压后 10 KB, 包含 10,000 个标签)

我们学习的第一门程序设计语言可能都是从Hello World入手的，在人工智能下的ｔｅｎｓｏｒｆｌｏｗ框架，也就是说人工智能的Hello World可能就是MNIST数据集识别，下面附上我的代码：

前向传播（mnist_forward.py）：

import tensorflow as tf
import tensorflow.contrib as contrib

INPUT_NODE = 784
OUTPUT_NODE = 10
LAYER1_NODE = 500

def get_weight(shape, regularizer):
    # tf.truncated_normal()从截断的正态分布中输出随机值, shape表示生成张量的维度，stddev是标准差
    w = tf.Variable(tf.truncated_normal(shape, stddev=0.1))
    # 将每个变量的正则化损失加入集合losses中
    if regularizer != None:
        tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(regularizer)(w))
    return w

def get_bias(shape):
    b = tf.Variable(tf.zeros(shape))
    return b

def forward(x, regularizer):
    w1 = get_weight([INPUT_NODE, LAYER1_NODE], regularizer)
    b1 = get_bias([