1.1.1 简介**
下载MNIST数据集,并打印一些基本信息:
python download.py
1.1.2 实验:将MNIST数据集保存为图片
python save_pic.py
1.1.3 图像标签的独热表示
打印MNIST数据集中图片的标签:
python label.py
1.2.1 Softmax 回归
python softmax_regression.py
1.2.2 两层卷积网络分类
python convolutional.py
1.1.1
coding:utf-8
# 从tensorflow.examples.tutorials.mnist引入模块。这是TensorFlow为了教学MNIST而提前编制的程序
from tensorflow.examples.tutorials.mnist import input_data
# 从MNIST_data/中读取MNIST数据。这条语句在数据不存在时,会自动执行下载
mnist = input_data.read_data_sets(“MNIST_data/”, one_hot=True)
# 查看训练数据的大小
print(mnist.train.images.shape) # (55000, 784)
print(mnist.train.labels.shape) # (55000, 10)
# 查看验证数据的大小
print(mnist.validation.images.shape) # (5000, 784)
print(mnist.validation.labels.shape) # (5000, 10)
# 查看测试数据的大小
print(mnist.test.images.shape) # (10000, 784)
print(mnist.test.labels.shape) # (10000, 10)
# 打印出第0幅图片的向量表示
print(mnist.train.images[0, :])
# 打印出第0幅图片的标签
print(mnist.train.labels[0, :])
1.1.2
#coding: utf-8
from tensorflow.examples.tutorials.mnist import input_data
import scipy.misc
import os
# 读取MNIST数据集。如果不存在会事先下载。
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)
# 我们把原始图片保存在MNIST_data/raw/文件夹下
# 如果没有这个文件夹会自动创建
save_dir = 'MNIST_data/raw/'
if os.path.exists(save_dir) is False:
os.makedirs(save_dir)
# 保存前20张图片
for i in range(20):
# 请注意,mnist.train.images[i, :]就表示第i张图片(序号从0开始)
image_array = mnist.train.images[i, :]
# TensorFlow中的MNIST图片是一个784维的向量,我们重新把它还原为28x28维的图像。
image_array = image_array.reshape(28, 28)
# 保存文件的格式为 mnist_train_0.jpg, mnist_train_1.jpg, ... ,mnist_train_19.jpg
filename = save_dir + 'mnist_train_%d.jpg' % i
# 将image_array保存为图片
# 先用scipy.misc.toimage转换为图像,再调用save直接保存。
scipy.misc.toimage(image_array, cmin=0.0, cmax=1.0).save(filename)
print('Please check: %s ' % save_dir)
scipy.misc.toimage
这里顺带说下scipy.misc.toimage函数
函数原来形式如下:
scipy.misc.toimage(*args,kwds)这个函数将在scipy 1.2.0版本中删除,将会用Pillow**的Image.formarray替代。
*args:输入的array;
**kwds:输入的关键字;
功能是输入一个numpy数组array,输出一个PIL图像。
这个功能只有在PIL安装后才能使用。输出的PIL图的模式依赖于array的形状和pal, mode这些关键字。
对于2-D arrays, 如果pal 是有效的(N,3) byte类的且其值在(0,255)间的RGB值, 那么mode=‘P’,否则mode=‘L’, 除非mode给出为’F’或‘I’,这种情况下将会创建浮点数 和/或 整数数组。
对于3-D arrays, ‘channel_axis’参数指示数组的哪个维度会保存通道数据。
对于3-D arrays, 如果某个维度是3, 默认mode是RGB或YCbCr。
numpy array 必须是2维或3维的。
1.1.3
# 看前20张训练图片的label
for i in range(