paddle实现手写数字识别（1）

Paddle深度学习：毕然老师的MNIST手写数字识别教程

原创

已于 2023-03-13 16:02:32 修改 · 648 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#paddle #python #机器学习

于 2023-03-12 11:06:32 首次发布

学习思路

内容来源于百度毕然老师学习课程教案。图1是毕然老师总结的“纵横学习方法”。
在这里插入图片描述首先基于百度的paddle来建模解决一个问题的思路，纵向上分为六个步骤，横向上对每一个步骤进行细分学习。

数据处理

# 设置数据读取器，API自动读取MNIST数据训练集
train_dataset = paddle.vision.datasets.MNIST(mode='train')

读取minst的train训练集数据，paddle内置了常规用于测试开发的数据集。

mnist
cifar
Conll05
imdb
imikolov
movielens
sentiment
uci_housing
wmt14
wmt16

可视化第一张图片数据

train_data_0 = np.array(train_dataset[0][0])
train_label_0 = np.array(train_dataset[0][1])

# 显示第一batch的第一个图像
import matplotlib.pyplot as plt
plt.figure("Image") # 图像窗口名称
plt.figure(figsize=(2,2))
plt.imshow(train_data_0, cmap=plt.cm.binary)
plt.axis('on') # 关掉坐标轴为 off
plt.title('image') # 图像题目
plt.show()

print("图像数据形状和对应数据为:", train_data_0.shape)
print("图像标签形状和对应数据为:", train_label_0.shape, train_label_0)
print("\n打印第一个batch的第一个图像，对应标签数字为{}".format(train_label_0))

在这里插入图片描述飞将api介绍

模型设计

在房价预测深度学习任务中，我们使用了单层且没有非线性变换的模型，取得了理想的预测效果。在手写数字识别中，我们依然使用这个模型预测输入的图形数字值。其中，模型的输入为784维（28×28）数据，输出为1维数据，如图4 所示。
在这里插入图片描述
输入像素的位置排布信息对理解图像内容非常重要（如将原始尺寸为 $28 \times 28$ 图像的像素按照 $7 \times 112$ 的尺寸排布，那么其中的数字将不可识别），因此网络的输入设计为 $28 \times 28$

最低0.47元/天解锁文章