深度学习实现minst手写数字识别

>- **🍨 本文为[🔗365天深度学习训练营](https://mp.weixin.qq.com/s/k-vYaC8l7uxX51WoypLkTw) 内部限免文章(版权归 *K同学啊* 所有)**
>- **🍦 参考文章地址: [🔗深度学习100-循环神经网络(RNN)心脏病预测 |46](https://blog.csdn.net/qq_38251616/article/details/126345651)**
>- **🍖 作者:[K同学啊 | 接辅导、程序定制](https://mp.weixin.qq.com/s/k-vYaC8l7uxX51WoypLkTw)**

# 设置GPU
import tensorflow as tf
gpus = tf.config.list_physical_devices("GPU")

if gpus:
    gpu0 = gpus[0] #如果有多个GPU,仅使用第0个GPU
    tf.config.experimental.set_memory_growth(gpu0, True) #设置GPU显存用量按需使用
    tf.config.set_visible_devices([gpu0],"GPU")

    

    
    
'''
tf.keras.datasets是一个公开的数据集接口,可以通过该方式直接获取相关机器学习的数据集
提供以下几个数据集:
boston_housing:波斯顿房屋价格回归数据集
cifar10:CIFAR10小图像分类数据集
cifar100:CIFAR100小图像分类数据集
fashion_mnist:Fashion-MNIST 数据集.
imdb:IMDB 分类数据集
mnist:MNIST手写数字数据集
reuters:路透社主题分类数据集
————————————————
原文链接:https://blog.youkuaiyun.com/New_Leaf/article/details/106310814
'''    
# 导入数据
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt

# 导入mnist数据,依次分别为训练集图片、训练集标签、测试集图片、测试集标签
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()

# 归一化
'''
归一化详解
1.作用
  使不同量纲的特征处于同一数值量级,减少方差大的特征的影响,使模型更准确。
  加快学习算法的收敛速度
归一化是将数据"拍扁"到指定的区间(仅由极值决定)-->把数变为(0,1)之间的小数;缩放仅仅跟最大、最小值的差别有关
标准化是更加“弹性”和“动态”的,和整体样本的分布有很大的关系--》将数据按比例缩放,使之落入一个小的特定区间;缩放与每个点都有关

归一化公式:(Xi - Xmin)/(Xmax - Xmin)

为什么使用归一化?
对图像进行归一化的操作,可以把不同维度的特征值调整到相近的范围内,可以采用统一的学习率加速模型训练

'''
# https://blog.youkuaiyun.com/qq_38251616/article/details/126048261
# 将像素的值标准化至0到1的区间内。(对于灰度图片来说,每个像素最大值是255,每个像素最小值是0,也就是直接除以255就可以完成归一化。)
train_images, test_images = train_images / 255.0, test_images / 255.0
# 查看数据维数信息
train_images.shape,test_images.shape,train_labels.shape,test_labels.shape
"""
输出:((60000, 28, 28), (10000, 28, 28), (60000,), (10000,))
60000代表的是样本数,(28,28)为图片的高和宽

"""

# 可视化图片
# 将数据集前20个图片数据可视化显示
# 进行图像大小为20宽、10长的绘图(单位为英寸inch)
plt.figure(figsize=(20,10))
# 遍历MNIST数据集下标数值0~19
for i in range(20):
    # 将整个figure分成2行10列,绘制第i+1个子图。
    plt.subplot(2,10,i+1)
    # 设置不显示x轴刻度
    plt.xticks([])
    # 设置不显示y轴刻度
    plt.yticks([])
    # 设置不显示子图网格线
    plt.grid(False)
    # 将数组的值以图片的形式展示出来,cmap参数用于设置颜色图谱,"plt.cm.binary"为matplotlib.cm中的色表(具体内容可网上搜索)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    # 设置x轴标签显示为图片对应的数字
    plt.xlabel(train_labels[i])
# 显示图片
plt.show()#绘图的作用

# 调整图片格式
#调整数据到我们需要的格式
train_images = train_images.reshape((60000, 28, 28, 1))#1代表的是灰度图
test_images = test_images.reshape((10000, 28, 28, 1))

train_images.shape,test_images.shape,train_labels.shape,test_labels.shape
"""
输出:((60000, 28, 28, 1), (10000, 28, 28, 1), (60000,), (10000,))
"""
# 构建CNN网络模型
'''
tf.keras.models.Sequential()用法
Sequential()方法是一个容器,描述了神经网络的网络结构,在Sequential()的输入参数中描述从输入层到输出层的网络结构

'''
'''
卷积操作的过程:首先设置卷积核的大小和数量,并且选取激活函数,激活函数的作用可以增强判定函数和整个神经网络的非线性特征,然后再把图像的形状
输入进去,如下代码,首先设置32个3*3的卷积核,对原始图像(28*28)进行卷积操作,得到26*26*32的输出卷积核。
池化层(非线性式的下采样):如下代码设置了2*2的下采样,则是对第一次卷积后的图像进行下采样,即对于一个26*26的图片每2*2的一个特征向量选取其最大值
最终得到一个13*13的图像特征图。

'''
'''
此实验修改了卷积核的尺寸大小,尝试3*3,5*5,7*7的卷积核大小,但结果基本没啥影响
卷积层的参数设置参考文章
https://blog.youkuaiyun.com/qq_42740834/article/details/123757816
'''
# 创建并设置卷积神经网络
# 卷积层:通过卷积操作对输入图像进行降维和特征抽取
# 池化层:是一种非线性形式的下采样。主要用于特征降维,压缩数据和参数的数量,减小过拟合,同时提高模型的鲁棒性。
# 全连接层:在经过几个卷积和池化层之后,神经网络中的高级推理通过全连接层来完成。
model = models.Sequential([
    # 设置二维卷积层1,设置32个3*3卷积核,activation参数将激活函数设置为ReLu函数,input_shape参数将图层的输入形状设置为(28, 28, 1)
    # ReLu函数作为激活励函数可以增强判定函数和整个神经网络的非线性特性,而本身并不会改变卷积层
    # 相比其它函数来说,ReLU函数更受青睐,这是因为它可以将神经网络的训练速度提升数倍,而并不会对模型的泛化准确度造成显著影响。
    layers.Conv2D(32, (7, 7), activation='relu', input_shape=(28, 28, 1)),
    #池化层1,2*2采样
    layers.MaxPooling2D((2, 2)),                   
    # 设置二维卷积层2,设置64个3*3卷积核,activation参数将激活函数设置为ReLu函数
    layers.Conv2D(64, (7, 7), activation='relu'),  
    #池化层2,2*2采样
    layers.MaxPooling2D((2, 2)),                   
    
    layers.Flatten(),                    #Flatten层,连接卷积层与全连接层
    layers.Dense(64, activation='relu'), #全连接层,特征进一步提取,64为输出空间的维数,activation参数将激活函数设置为ReLu函数
    layers.Dense(10)                     #输出层,输出预期结果,10为输出空间的维数
])
# 打印网络结构
model.summary()

# 编译模型
"""
这里设置优化器、损失函数以及metrics
这三者具体介绍可参考我的博客:
https://blog.youkuaiyun.com/qq_38251616/category_10258234.html
"""
'''
原文链接:https://blog.youkuaiyun.com/zhangleaimeiling/article/details/124252311
model.compile()语法
形式1:
model.compile(optimizer = tf.keras.optimizers.优化器(参数),
loss = tf.keras.losses.损失函数(参数),
metrics = [“sparse_accuracy”])

形式2:
model.compile(optimizer = “sgd”,
loss = “mse”,
metrics = [“sparse_accuracy”])

参数设置
1-optimizer:预定义优化器名或优化器对象
(1).“sgd” 或者 tf.optimizers.SGD(lr = 学习率, decay = 学习率衰减率,momentum = 动量参数)

(2).“adagrad” 或者 tf.keras.optimizers.Adagrad(lr = 学习率, decay = 学习率衰减率)

(3).“adadelta” 或者 tf.keras.optimizers.Adadelta(lr = 学习率,decay = 学习率衰减率)

(4).“adam” 或者 tf.keras.optimizers.Adam(lr = 学习率, decay = 学习率衰减率)

2-loss:预定义损失函数或一个目标函数
(1).“mse” 或者 “mean squared error” 或者 tf.keras.losses.MeanSquaredError()

(2).“sparse_categorical_crossentropy” 或 tf.keras.losses.SparseCatagoricalCrossentropy(from_logits = False

3-Metrics:评估模型在训练和测试时的性能的指标
(1).“accuracy” :

(2).“sparse_accuracy":

(3).“sparse_categorical_accuracy” :

'''
# model.compile()方法用于在配置训练方法时,告知训练时用的优化器、损失函数和准确率评测标准
model.compile(
	# 设置优化器为Adam优化器
    optimizer='adam',
	# 设置损失函数为交叉熵损失函数(tf.keras.losses.SparseCategoricalCrossentropy())
    # from_logits为True时,会将y_pred转化为概率(用softmax),否则不进行转换,通常情况下用True结果更稳定
    loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    # 设置性能指标列表,将在模型训练时监控列表中的指标
    metrics=['accuracy'])

# 训练模型
"""
这里设置输入训练数据集(图片及标签)、验证数据集(图片及标签)以及迭代次数epochs
关于model.fit()函数的具体介绍可参考我的博客:
https://blog.youkuaiyun.com/qq_38251616/category_10258234.html
"""
history = model.fit(
    # 输入训练集图片
	train_images, 
	# 输入训练集标签
	train_labels, 
	# 设置10个epoch,每一个epoch都将会把所有的数据输入模型完成一次训练。
	epochs=10, 
	# 设置验证集
    validation_data=(test_images, test_labels))

# 预测
plt.imshow(test_images[1])
pre = model.predict(test_images) # 对所有测试图片进行预测
pre[1] # 输出第一张图片的预测结果





在这里插入图片描述

Model: "sequential_9"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_18 (Conv2D)           (None, 22, 22, 32)        1600      
_________________________________________________________________
max_pooling2d_18 (MaxPooling (None, 11, 11, 32)        0         
_________________________________________________________________
conv2d_19 (Conv2D)           (None, 5, 5, 64)          100416    
_________________________________________________________________
max_pooling2d_19 (MaxPooling (None, 2, 2, 64)          0         
_________________________________________________________________
flatten_9 (Flatten)          (None, 256)               0         
_________________________________________________________________
dense_18 (Dense)             (None, 64)                16448     
_________________________________________________________________
dense_19 (Dense)             (None, 10)                650       
=================================================================
Total params: 119,114
Trainable params: 119,114
Non-trainable params: 0
_________________________________________________________________
Epoch 1/10
1875/1875 [==============================] - 4s 2ms/step - loss: 0.1569 - accuracy: 0.9519 - val_loss: 0.0614 - val_accuracy: 0.9797
Epoch 2/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0520 - accuracy: 0.9838 - val_loss: 0.0445 - val_accuracy: 0.9882
Epoch 3/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0365 - accuracy: 0.9887 - val_loss: 0.0470 - val_accuracy: 0.9840
Epoch 4/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0269 - accuracy: 0.9917 - val_loss: 0.0359 - val_accuracy: 0.9884
Epoch 5/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0221 - accuracy: 0.9930 - val_loss: 0.0345 - val_accuracy: 0.9888
Epoch 6/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0184 - accuracy: 0.9942 - val_loss: 0.0367 - val_accuracy: 0.9897
Epoch 7/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0146 - accuracy: 0.9951 - val_loss: 0.0428 - val_accuracy: 0.9883
Epoch 8/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0125 - accuracy: 0.9962 - val_loss: 0.0344 - val_accuracy: 0.9900
Epoch 9/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0115 - accuracy: 0.9962 - val_loss: 0.0403 - val_accuracy: 0.9892
Epoch 10/10
1875/1875 [==============================] - 3s 2ms/step - loss: 0.0102 - accuracy: 0.9969 - val_loss: 0.0381 - val_accuracy: 0.9890
![预测结果](https://img-blog.csdnimg.cn/aea09a767ee84fc5944dd8628f2d032b.png#pic_center)

在这里插入图片描述

array([  1.7724704,  -3.389056 ,  21.480179 ,  -3.5979428,  -3.4272287,
       -20.61196  ,   1.7663294,  -2.936949 ,  -2.2348194, -14.06618  ],
      dtype=float32)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zteyISk0-1660917542466)(output_0_3.png)]


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值