MNIST手写数字识别_数据读取
基于已经下载好本地数据集或是通过keras成功导入数据集:
1.本地数据集
# 导入数据
mnist = input_data.read_data_sets('D:\pythonProject1\MNIST\MNIST_data',one_hot=True)
#路径为存储MNIST数据集的地址
#one_hot=True 设置热编码
One-Hot编码,又称为一位有效编码,主要是采用位状态寄存器来对个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。独热编码 是利用0和1表示一些参数,使用N位状态寄存器来对N个状态进行编码。
如本程序中对MNIST便签的热编码:
0,1,2,3,4,5,6,7,8,9的热编码
由于该数据集预先分割了训练数据集和测试数据集,我们仅需输入以下代码即可:
train_X = mnist.train.images
train_Y = mnist.train.labels
test_X = mnist.test.images
test_Y = mnist.test.labels
print(train_X.shape, train_Y.shape) # (55000, 784) (55000, 10)
print(test_X.shape, test_Y.shape) # (10000, 784) (10000, 10)
训练图片为55000张,28×28,训练标签为55000个,热编码为10位数字。
测试图片为10000张,28×28,测试标签为10000个,热编码为10位数字。
显示出第一个图片和标签及其数据类型:
print(train_X[0],type(train_X)) # <class 'numpy.ndarray'>
print(train_Y[0]