pytorch学习（二）搭建简易神经网络

最新推荐文章于 2025-02-07 17:08:30 发布

原创最新推荐文章于 2025-02-07 17:08:30 发布 · 813 阅读

1 ·

CC 4.0 BY-SA版权

pytorch 专栏收录该内容

9 篇文章

订阅专栏

本文介绍了如何在PyTorch中搭建一个简单的神经网络，包括定义网络、设置模型参数、选择损失函数、执行反向传播以及更新权重的过程。讲解了forward函数的使用，模型参数的获取，以及优化器在反向传播和权重更新中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

定义网络
- 模型参数
损失函数
反向传播
更新权重
- backward 和 optimizer 之间的交互：
参考资料

一个神经网络的典型训练过程如下：

定义包含一些可学习参数（或称为权重）的神经网络
在输入数据上迭代
通过网络处理输入，得到预测值
计算损失（预测值和正确答案的距离）
将梯度反向传播给网络参数
更新权重

定义网络

import torch
import torch.nn as nn

class Model(nn.Module):
    def __init__(self):
        super(Model,self).__init__()
        self.conv1 = nn.Conv2d(1,20,5)
        self.conv2 = nn.Conv2d(20,20,5)
        
    def forward(self,x): #定义一个前向网络
        x = nn.functional.relu(self.conv1(x))
        return nn.functional.relu(self.conv2(x))
        
model = Model()
print(model)

在模型定义过程中，仅需定义forward函数，用于对张量进行一些操作和计算，而backward函数是在使用autograd时自动定义的，用于计算导数。

模型参数

模型的学习参数：model.parameters()

params = list(model.parameters())
print(params[0].size()) # conv1的权重

torch.nn 只支持小批量的数据处理

损失函数

torch.nn 中包含很多损失函数，例如nn.MSELoss

criterion = torch.nn.MSELoss(size_average=True) # 平方误差损失

size_average 参数表示在计算loss时是计算所有样本还是部分样本

反向传播

一般用loss.backward()计算权重，需注意每次都需要清零现有的梯度。

model.zero_grad()
loss.backward()

更新权重

最简单的权重更新方法是随机梯度下降算法，尝试用Python实现：

lr=0.1
for f in model.parameters():
	f.data.sub_(f.grad.data *lr)

在torch.optim包中封装了各种不同的优化算法，如：SGD、Nesterov-SGD、Adam、RMSProp等。

import torch.optim as optim

# 创建更新函数器
optimizer = optim.SGD(model.parameters(),lr=0.1)

# 在训练的迭代中：
optimizer.zero_grad()   # 清零梯度缓存
output = model(input)
loss = criterion(output, target)
loss.backward()
optimizer.step()    # 更新参数

optimizer.step() 一旦梯度被计算时(backward())，优化函数即可被调用;