PyTorch学习笔记(二)——torch.nn解析

本文通过逐步添加PyTorch的模块,如torch.nn和torch.optim,展示了如何从手动搭建神经网络过渡到使用高级API的过程。通过重构代码,提高了模型训练的效率和代码的简洁性。

PyTorch提供了方便漂亮的类和模块,来帮助我们创建和训练神经网络,例如 torch.nn, torch.optim 等。
为了更好地理解这些模块的功能和原理,我们在手动搭建的神经网络上,逐步添加这些模块,以显示每部分模块的功能,以及每部分是如何让代码更加灵活简洁的。

1、手动搭建神经网络

使用MNIST数据集,该数据集共有50000个图片,每一图片大小为2828,储存在长度为2828=784的扁平行。

#定义权重和偏执值,需要requires_grad=True,以便自动计算梯度,完成反馈
weights = torch.randn(784, 10,requires_grad=True)
bias = torch.zeros(10, requires_grad=True)

#定义激活函数
def log_softmax(x):
    return x - x.exp().sum(-1).log().unsqueeze(-1)
    
#定义神经网络运算过程,其中@表示点乘
def model(xb):
    return log_softmax(xb @ weights + bias)

#定义代价函数
def nll(input, target):
    return -input[range(target.shape[0]), target].mean()
loss_func = nll

#验证结果的准确性
def accuracy(out, yb):
    preds = torch.argmax(out, dim=1)
    return (preds == yb).float().mean()

#获取一批数据,验证预测的结果:
bs = 64                  # batch size
xb = x_train[0:bs]       # a mini-batch from x
yb = y_train[0:bs]
preds = model(xb)        # predictions
print(preds[0], preds.shape)
print(loss_func(preds, yb))
print(accuracy(preds, yb))
输出:
tensor([-1.7022, -3.0342, -2.4138, -2.6452, -2.7764, -2.0892, -
<think> 我们被要求解析给定的代码片段。这个代码片段看起来是一个PyTorch深度学习项目的开头,包括导入必要的库和模块,以及使用wandb(Weights & Biases)进行实验跟踪。 首先,我们逐行解释代码: 1. `import math`: 导入Python的数学库,提供数学运算函数(如cos, sin, sqrt等)。 2. `from pathlib import Path`: 导入Path类,用于处理文件路径。 3. `from types import SimpleNamespace`: 导入SimpleNamespace,用于创建一个简单的对象,允许我们使用点号(.)访问其属性(类似于一个简单的类实例)。 4. `from tqdm.auto import tqdm`: 导入tqdm(进度条库)的auto模块,可以自动选择控制台或Jupyter笔记本中的进度条。 5. `import torch`: 导入PyTorch库,用于构建和训练神经网络。 6. `import torch.nn as nn`: 导入PyTorch的神经网络模块,包含各种层(如Linear, Conv2d)和损失函数等。 7. `import torch.nn.functional as F`: 导入PyTorch中的函数模块,包含激活函数(如relu)、损失函数(如cross_entropy)等,通常用于无状态的函数。 8. `from torch.optim import Adam`: 导入Adam优化器。 9. `from utilities import get_dataloaders`: 从utilities模块中导入get_dataloaders函数,该函数可能是自定义的,用于获取数据加载器(DataLoader)。 10. `import wandb`: 导入Weights & Biases库,用于跟踪实验、记录指标和可视化。 这段代码没有具体的功能实现,只是导入了后续可能用到的库和函数。 但是,根据问题要求,我们需要给出详尽的解决方案,包括代码和解释。由于这里只是导入部分,我们可能需要补充完整的训练流程。 假设这是一个图像分类任务,我们可以构建一个简单的CNN模型,并使用get_dataloaders来获取训练和验证数据加载器。然后使用Adam优化器进行训练,并使用wandb记录训练过程。 下面,我们将补充一个完整的训练脚本,包括: 1. 定义配置(使用SimpleNamespace) 2. 定义模型(一个简单的CNN) 3. 训练循环和验证循环 4. 使用wandb初始化并记录 注意:由于get_dataloaders函数是自定义的,我们假设它返回三个数据加载器:train_loader, val_loader, test_loader(或两个:train和val)。如果没有,我们可以稍作调整。 我们将按照以下步骤: 步骤1:定义配置参数 步骤2:初始化wandb 步骤3:设置设备(GPU或CPU) 步骤4:创建模型 步骤5:定义损失函数和优化器 步骤6:训练和验证循环 由于问题要求是代码解析,但实际给出的代码不完整,我们将编写一个完整的示例,并解释。 </think>以下是对提供的代码片段的解析和解释。这段代码是一个深度学习项目的初始设置,主要包含导入必要的Python库和模块: ```python import math # 导入数学库,提供数学运算函数 from pathlib import Path # 面向对象的文件系统路径处理 from types import SimpleNamespace # 创建简单命名空间对象 from tqdm.auto import tqdm # 进度条显示,auto自动选择最佳显示方式 import torch # PyTorch深度学习框架 import torch.nn as nn # 神经网络模块 import torch.nn.functional as F # 神经网络函数接口 from torch.optim import Adam # Adam优化器 from utilities import get_dataloaders # 自定义数据加载工具 import wandb # 实验跟踪和可视化工具 ``` ### 代码解析: 1. **数学和系统工具** ```python import math from pathlib import Path from types import SimpleNamespace ``` - `math`:提供数学函数(如三角函数、对数等) - `Path`:面向对象的文件路径操作,替代传统的`os.path` - `SimpleNamespace`:创建轻量级对象用于存储配置参数 2. **进度条工具** ```python from tqdm.auto import tqdm ``` - `tqdm`:显示训练进度条 - `auto`:自动检测运行环境(Jupyter/终端)选择最佳显示方式 3. **PyTorch核心组件** ```python import torch import torch.nn as nn import torch.nn.functional as F from torch.optim import Adam ``` - `torch`:张量操作和GPU加速 - `nn`:预定义神经网络层(线性层、卷积层等) - `F`:函数式接口(激活函数、损失函数等) - `Adam`:常用的优化算法 4. **自定义工具** ```python from utilities import get_dataloaders ``` - 预期实现数据加载功能,返回训练/验证/测试的DataLoader 5. **实验管理** ```python import wandb ``` - Weights & Biases库,用于: - 超参数跟踪 - 指标可视化 - 模型版本管理 - 实验结果比较 ### 典型使用场景 这段代码通常出现在深度学习项目的开头,用于设置训练环境。一个完整的训练流程可能如下: ```python # 配置参数 config = SimpleNamespace( epochs=10, lr=0.001, batch_size=32, data_dir=Path("/data") ) # 初始化wandb wandb.init(project="my_project", config=config) # 获取数据 train_loader, val_loader = get_dataloaders(config.data_dir, config.batch_size) # 定义模型 class MyModel(nn.Module): def __init__(self): super().__init__() self.fc = nn.Linear(784, 10) def forward(self, x): return self.fc(x) model = MyModel().to(device) optimizer = Adam(model.parameters(), lr=config.lr) # 训练循环 for epoch in tqdm(range(config.epochs)): model.train() for batch in train_loader: x, y = batch optimizer.zero_grad() output = model(x) loss = F.cross_entropy(output, y) loss.backward() optimizer.step() # 记录指标 wandb.log({"train_loss": loss.item()}) # 验证循环 model.eval() with torch.no_grad(): # ...验证代码... ``` ### 各组件作用总结 | 组件 | 功能 | 重要性 | |------|------|--------| | `torch` | 张量计算和GPU加速 | 核心 | | `nn` | 神经网络构建 | 核心 | | `tqdm` | 训练进度可视化 | 辅助 | | `wandb` | 实验管理和可视化 | 可选项 | | `get_dataloaders` | 数据加载封装 | 项目特定 |
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值