T1：使用 tensorflow实现mnist手写数字识别

TensorFlow深度学习实验总结

最新推荐文章于 2025-02-05 01:02:47 发布

原创最新推荐文章于 2025-02-05 01:02:47 发布 · 885 阅读

19 ·

CC 4.0 BY-SA版权

文章标签：

#tensorflow #人工智能 #python

部署运行你感兴趣的模型镜像

🍨 本文为🔗365天深度学习训练营中的学习记录博客
🍖 原作者：K同学啊

我的环境

语言环境：python 1.7.12
编译器：VS Code
深度学习环境：tensorflow 2.7.0

实验过程

import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt
# 导入mnist数据，依次分别为训练集图片、训练集标签、测试集图片、测试集标签
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()

在这里插入图片描述

# 将像素的值标准化至0到1的区间内。(对于灰度图片来说，每个像素最大值是255，每个像素最小值是0，也就是直接除以255就可以完成归一化。)
train_images, test_images = train_images / 255.0, test_images / 255.0
# 查看数据维数信息
train_images.shape,test_images.shape,train_labels.shape,test_labels.shape

在这里插入图片描述

# 将数据集前20个图片数据可视化显示
# 进行图像大小为20宽、10长的绘图(单位为英寸inch)
plt.figure(figsize=(20,10))
# 遍历MNIST数据集下标数值0~49
for i in range(20):
    # 将整个figure分成2行10列，绘制第i+1个子图。
    plt.subplot(2,10,i+1)
    # 设置不显示x轴刻度
    plt.xticks([])
    # 设置不显示y轴刻度
    plt.yticks([])
    # 设置不显示子图网格线
    plt.grid(False)
    # 图像展示，cmap为颜色图谱，"plt.cm.binary"为matplotlib.cm中的色表
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    # 设置x轴标签显示为图片对应的数字
    plt.xlabel(train_labels[i])
# 显示图片
plt.show()

在这里插入图片描述

#调整数据到我们需要的格式
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))

train_images.shape,test_images.shape,train_labels.shape,test_labels.shape
"""
输出：((60000, 28, 28, 1), (10000, 28, 28, 1), (60000,), (10000,))
"""

# 创建并设置卷积神经网络
# 卷积层：通过卷积操作对输入图像进行降维和特征抽取
# 池化层：是一种非线性形式的下采样。主要用于特征降维，压缩数据和参数的数量，减小过拟合，同时提高模型的鲁棒性。
# 全连接层：在经过几个卷积和池化层之后，神经网络中的高级推理通过全连接层来完成。
model = models.Sequential([
    # 设置二维卷积层1，设置32个3*3卷积核，activation参数将激活函数设置为ReLu函数，input_shape参数将图层的输入形状设置为(28, 28, 1)
    # ReLu函数作为激活励函数可以增强判定函数和整个神经网络的非线性特性，而本身并不会改变卷积层
    # 相比其它函数来说，ReLU函数更受青睐，这是因为它可以将神经网络的训练速度提升数倍，而并不会对模型的泛化准确度造成显著影响。
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    #池化层1，2*2采样
    layers.MaxPooling2D((2, 2)),                   
    # 设置二维卷积层2，设置64个3*3卷积核，activation参数将激活函数设置为ReLu函数
    layers.Conv2D(64, (3, 3), activation='relu'),  
    #池化层2，2*2采样
    layers.MaxPooling2D((2, 2)),                   
    
    layers.Flatten(),                    #Flatten层，连接卷积层与全连接层
    layers.Dense(64, activation='relu'), #全连接层，特征进一步提取，64为输出空间的维数，activation参数将激活函数设置为ReLu函数
    layers.Dense(10)                     #输出层，输出预期结果，10为输出空间的维数
])
# 打印网络结构
model.summary()

在这里插入图片描述

"""
这里设置优化器、损失函数以及metrics
"""
# model.compile()方法用于在配置训练方法时，告知训练时用的优化器、损失函数和准确率评测标准
model.compile(
	# 设置优化器为Adam优化器
    optimizer='adam',
	# 设置损失函数为交叉熵损失函数（tf.keras.losses.SparseCategoricalCrossentropy()）
    # from_logits为True时，会将y_pred转化为概率（用softmax），否则不进行转换，通常情况下用True结果更稳定
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    # 设置性能指标列表，将在模型训练时监控列表中的指标
    metrics=['accuracy'])

"""
这里设置输入训练数据集（图片及标签）、验证数据集（图片及标签）以及迭代次数epochs
关于model.fit()函数的具体介绍可参考我的博客：
https://blog.youkuaiyun.com/qq_38251616/article/details/122321757
"""
history = model.fit(
    # 输入训练集图片
	train_images, 
	# 输入训练集标签
	train_labels, 
	# 设置10个epoch，每一个epoch都将会把所有的数据输入模型完成一次训练。
	epochs=10, 
	# 设置验证集
    validation_data=(test_images, test_labels))

在这里插入图片描述

plt.imshow(test_images[2])

在这里插入图片描述

pre = model.predict(test_images) # 对所有测试图片进行预测
pre[2] # 输出第二张图片的预测结果

array([ -7.8039684, 10.225527 , -7.594961 , -12.786287 , -0.9982029,
-2.9609454, -6.605214 , -2.6741672, -2.8507025, -5.7724495],
dtype=float32)

总结

这周算是形成一个对深度学习的初步认识，了解神经网络的一个过程。另外记录一下其他学到小知识。

使用神经网络大致流程

1.数据导入
2.数据预处理
3.选择模型并构建
4.配置模型的编译配置
5.模型训练
6.预测

from_logits 参数

默认值：from_logits=False 表示输入的张量应该是概率分布，而不是原始的未归一化的对数（logits）。
含义：

如果 from_logits=False，那么输入的张量应该已经被 softmax 函数处理过，即每个样本的输出应该是一个概率分布（每个类别的概率之和为1）。
如果 from_logits=True，那么输入的张量应该是未经处理的对数值（logits），即模型的最后一层没有使用激活函数（如softmax），此时损失函数内部会自动应用softmax函数。
在本次实验中，神经网络模型的输出层没有使用 softmax 激活函数，可以设置from_logits为True。

输出预测概率

若要输出预测概率而不是logits值则可以继续添加以下代码

import numpy as np
logits = pre[2]
probabilities = tf.nn.softmax(logits).numpy()
print(np.sum(probabilities))
probabilities

在这里插入图片描述

输出预测类别

若要输出预测类别则可以使用以下代码

predicted_class = np.argmax(probabilities)
predicted_class

在这里插入图片描述
预测结果为“1”与图片数字符合。

您可能感兴趣的与本文相关的镜像

TensorFlow-v2.15

TensorFlow

TensorFlow 是由Google Brain 团队开发的开源机器学习框架,广泛应用于深度学习研究和生产环境。它提供了一个灵活的平台,用于构建和训练各种机器学习模型

T1：使用 tensorflow实现mnist手写数字识别

我的环境

实验过程

总结

使用神经网络大致流程

from_logits 参数

输出预测概率

输出预测类别

2 条评论