手写数字识别项目

桑榆0806

于 2025-03-06 10:27:42 发布

阅读量1.5k

点赞数 16

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/2502_90677941/article/details/146060805

版权

构建模型（假设为model）后，接下来就是训练模型。PyTorch训练模型主要包括加载数据集、损失计算、定义优化算法、反向传播、参数更新等主要步骤。

加载预处理数据集

加载预处理数据集，可以使用PyTorch的数据处理工具，如torch.utils和torchvision等，这些工具将在第4章详细介绍。

定义损失函数

定义损失函数可以通过自定义方法或使用PyTorch内置的损失函数，如回归使用的loss_fun=nn.MSELoss()，分类使用的nn.BCELoss等损失函数，更多内容可参考本书5.2.4节。

定义优化方法

PyTorch常用的优化方法都封装在torch.optim里面，其设计很灵活，可以扩展为自定义的优化方法。所有的优化方法都是继承了基类optim.Optimizer，并实现了自己的优化步骤。

最常用的优化算法就是梯度下降法及其各种变种，具体将在5.4节详细介绍，这些优化算法大多使用梯度更新参数。

如使用SGD优化器时，可设置为optimizer = torch.optim.SGD(params,lr = 0.001)。

循环训练模型

1）设置为训练模式：

model.train()

调用model.train()会把所有的module设置为训练模式。

2）梯度清零：

optimizer.zero_grad()

在默认情况下梯度是累加的，需要手工把梯度初始化或清零，调用optimizer.zero_grad() 即可。

3）求损失值：

y_prev=model(x)

loss=loss_fun(y_prev,y_true)

4）自动求导，实现梯度的反向传播：

loss.backward()

5）更新参数：

optimizer.step()

循环测试或验证模型

1）设置为测试或验证模式：

model.eval()

调用model.eval()会把所有的training属性设置为False。

2）在不跟踪梯度模式下计算损失值、预测值等：

with torch.no_grad():

可视化结果

下面我们通过实例来说明如何使用nn来构建网络模型、训练模型。

【说明】model.train()与model.eval()的使用

如果模型中有BN（Batch Normalization）层和Dropout，需要在训练时添加model.train()，

在测试时添加model.eval()。其中model.train()是保证BN层用每一批数据的均值和方差，而model.eval()是保证BN用全部训练数据的均值和方差；而对于Dropout，model.train()是随机取一部分网络连接来训练更新参数，而model.eval()是利用到了所有网络连接。

3.5实现神经网络实例

前面我们介绍了使用PyTorch构建神经网络的一些组件、常用方法和主要步骤等，本节通过一个构建神经网络的实例把这些内容有机结合起来。

3.5.1背景说明

本节将利用神经网络完成对手写数字进行识别的实例，来说明如何借助nn工具箱来实现一个神经网络，并对神经网络有个直观了解。在这个基础上，后续我们将对nn的各模块进行详细介绍。实例环境使用PyTorch1.5+，GPU或CPU，源数据集为MNIST。

主要步骤如下。

- 利用PyTorch内置函数mnist下载数据。

- 利用torchvision对数据进行预处理，调用torch.utils建立一个数据迭代器。

- 可视化源数据。

- 利用nn工具箱构建神经网络模型。

- 实例化模型，并定义损失函数及优化器。

- 训练模型。

- 可视化结果。

神经网络的结构如图3 - 5所示。

使用两个隐含层，每层使用ReLU激活函数，输出层使用softmax激活函数，最后使用torch.max(out,1)找出张量out最大值对应索引作为预测值。

【说明】

transforms.Compose可以把一些转换函数组合在一起。

Normalize([0.5], [0.5])对张量进行归一化，这里两个0.5分别表示对张量进行归一化的全局平均值和方差。因图像是灰色的只有一个通道，如果有多个通道，需要有多个数字，如三个通道，应该是Normalize([n1,n2,n3], [n1,n2,n3])。

download参数控制是否需要下载，如果./data目录下已有MNIST，可选择False。

用DataLoader得到生成器，这可节省内存。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。