学习思路
内容来源于百度毕然老师学习课程教案。图1是毕然老师总结的“纵横学习方法”。
首先基于百度的paddle来建模解决一个问题的思路,纵向上分为六个步骤,横向上对每一个步骤进行细分学习。
数据处理
# 设置数据读取器,API自动读取MNIST数据训练集
train_dataset = paddle.vision.datasets.MNIST(mode='train')
读取minst的train训练集数据,paddle内置了常规用于测试开发的数据集。
mnist
cifar
Conll05
imdb
imikolov
movielens
sentiment
uci_housing
wmt14
wmt16
可视化第一张图片数据
train_data_0 = np.array(train_dataset[0][0])
train_label_0 = np.array(train_dataset[0][1])
# 显示第一batch的第一个图像
import matplotlib.pyplot as plt
plt.figure("Image") # 图像窗口名称
plt.figure(figsize=(2,2))
plt.imshow(train_data_0, cmap=plt.cm.binary)
plt.axis('on') # 关掉坐标轴为 off
plt.title('image') # 图像题目
plt.show()
print("图像数据形状和对应数据为:", train_data_0.shape)
print("图像标签形状和对应数据为:", train_label_0.shape, train_label_0)
print("\n打印第一个batch的第一个图像,对应标签数字为{}".format(train_label_0))
飞将api介绍

模型设计
在房价预测深度学习任务中,我们使用了单层且没有非线性变换的模型,取得了理想的预测效果。在手写数字识别中,我们依然使用这个模型预测输入的图形数字值。其中,模型的输入为784维(28×28)数据,输出为1维数据,如 图4 所示。

输入像素的位置排布信息对理解图像内容非常重要(如将原始尺寸为28×2828×2828×28图像的像素按照7×1127×1127×112的尺寸排布,那么其中的数字将不可识别),因此网络的输入设计为28×2828×2828×28
Paddle深度学习:毕然老师的MNIST手写数字识别教程

最低0.47元/天 解锁文章
1290

被折叠的 条评论
为什么被折叠?



