mnist数据集，keras实现简单密集链接（全连接）

最新推荐文章于 2023-12-26 08:16:23 发布

Michael菜鸟

最新推荐文章于 2023-12-26 08:16:23 发布

阅读量444

点赞数 1

分类专栏：教学文章标签：深度学习 tensorflow

本文链接：https://blog.youkuaiyun.com/weixin_46490003/article/details/109724075

版权

教学专栏收录该内容

12 篇文章

订阅专栏

本文介绍了使用TensorFlow 2.3中的Keras库进行MNIST数据集手写数字识别的全过程，包括数据预处理、模型构建、训练及评估。通过实例展示了如何创建一个简单的神经网络并实现图像分类。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

我用到的是tensorflow2.3里的keras，cuda：10.1
代码：
#%%

import tensorflow as tf
from tensorflow import keras

import numpy as np
import matplotlib.pyplot as plt



#%%

mnist = keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()


#%%

class_names = []
for i in range(0, 10):
    class_names.append('%d' % i)


#%%

# class_names

#%%

# train_images.shape

#%%

# len(train_labels)

#%%

# train_labels

#%%

# test_images.shape

#%%

# len(test_labels)

#%%

plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()


#%%

train_images = train_images / 255
test_images = test_images / 255

#%%

plt.figure(figsize=(5, 5))
for i in range(25):
    plt.subplot(5, 5, i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()


#%%

model = keras.Sequential([keras.layers.Flatten(input_shape=(train_images.shape[1:])),
                          keras.layers.Dense(128, activation='relu'),
                          keras.layers.Dense(10)])
"""
该网络的第一层 tf.keras.layers.Flatten 将图像格式从二维数组（28 x 28 像素）转换成一维数组（28 x 28 = 784 像素）。将该层视为图像中未堆叠
的像素行并将其排列起来。该层没有要学习的参数，它只会重新格式化数据。

展平像素后，网络会包括两个 tf.keras.layers.Dense 层的序列。它们是密集连接或全连接神经层。第一个 Dense 层有 128 个节点（或神经元）。第二个
（也是最后一个）层会返回一个长度为 10 的 logits 数组。每个节点都包含一个得分，用来表示当前图像属于 10 个类中的哪一类。
"""

#%%

model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])


#%%

model.fit(train_images, train_labels, epochs=20)


#%%

test_loss, test_accuracy = model.evaluate(test_images, test_labels, verbose=2)

print('\nTest accuracy:', test_accuracy)

#%%

probability_model = tf.keras.Sequential([model, tf.keras.layers.Softmax()])

#%%

# 在新数据集上预测
predictions = probability_model.predict(test_images)

#%%
# 输出第一个数字的结果
p = np.array(predictions[0], np.uint8)

#%%

print(np.argmax(predictions[0]))

#%%

plt.figure()
plt.imshow(test_images[0])
plt.colorbar()
plt.grid(False)
plt.show()


#%%

# 使用训练好的Model对单个图像进行预测
img = test_images[1]
print(img.shape)

#%%

img = (np.expand_dims(img, 0))
print(img.shape)

#%%

predictions_single = probability_model.predict(img)
print(predictions_single)

#%%

np.argmax(predictions_single[0])

#%%

plt.figure()
plt.imshow(test_images[1])
plt.colorbar()
plt.grid(False)
plt.show()