PyTorch入门指南：从安装到快速上手-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00532/article/details/148392895

PyTorch入门指南：从安装到快速上手

pytorch-book PyTorch tutorials and fun projects including neural talk, neural style, poem writing, anime generation (《深度学习框架PyTorch：入门与实战》) 项目地址: https://gitcode.com/gh_mirrors/py/pytorch-book

PyTorch作为当前最流行的深度学习框架之一，以其简洁的API设计和动态计算图特性广受研究人员和开发者的喜爱。本文将基于PyTorch官方教程，带你从零开始快速掌握PyTorch的核心概念和基本使用方法。

环境安装与配置

PyTorch支持多种安装方式，用户可以根据自己的操作系统和硬件条件选择最适合的安装方法。

Linux系统安装

在Linux环境下，推荐使用Anaconda管理Python环境，并通过conda或pip安装PyTorch：

# 使用conda安装（推荐）
conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

# 使用pip安装
pip install torch==1.8.0 torchvision==0.9.0 torchaudio==0.8.0

安装完成后，可以通过以下命令验证是否安装成功：

import torch
print(torch.__version__)  # 查看PyTorch版本
print(torch.cuda.is_available())  # 检查CUDA是否可用

Windows系统安装

Windows下的安装与Linux类似，同样支持conda和pip两种方式。需要注意的是，Windows系统需要单独安装CUDA工具包以支持GPU加速。

开发工具推荐

Jupyter Notebook

Jupyter Notebook是数据科学领域最流行的交互式开发环境，特别适合PyTorch的学习和实验：

pip install jupyter
jupyter notebook

Jupyter Notebook提供了代码执行、可视化、文档编写一体化的环境，是学习PyTorch的理想选择。

VS Code

对于大型项目开发，推荐使用VS Code配合Python插件和Jupyter插件：

安装VS Code
通过扩展市场安装Python和Jupyter插件
创建.py或.ipynb文件开始开发

VS Code提供了代码补全、调试、版本控制等强大功能，适合专业开发。

PyTorch核心概念

Tensor基础操作

Tensor是PyTorch中最基本的数据结构，类似于NumPy的ndarray，但支持GPU加速：

import torch as t

# 创建Tensor
x = t.rand(2, 3)  # 2x3的随机矩阵
y = t.ones(2, 3)  # 全1矩阵

# Tensor运算
z = x + y  # 逐元素相加
z = t.add(x, y)  # 等价写法

Tensor支持丰富的数学运算和维度变换操作：

# 维度变换
x = t.randn(4, 4)
y = x.view(16)  # 展平为一维
z = x.view(-1, 8)  # -1表示自动计算该维度大小

# 维度交换
x = t.randn(2, 3, 4)
y = x.permute(2, 0, 1)  # 维度重排

自动微分（autograd）

PyTorch的autograd模块实现了自动微分功能，极大简化了梯度计算：

# 创建需要求导的Tensor
x = t.ones(2, 2, requires_grad=True)

# 计算函数值
y = x.sum()  # y = x[0,0] + x[0,1] + x[1,0] + x[1,1]

# 反向传播计算梯度
y.backward()

# 查看梯度
print(x.grad)  # 所有元素的梯度都为1

autograd会自动记录计算图，并在调用backward()时计算所有梯度。需要注意的是，梯度是累加的，因此在每次反向传播前需要清零：

x.grad.data.zero_()  # 梯度清零

神经网络构建

PyTorch提供了torch.nn模块来简化神经网络的构建过程。下面是一个简单的全连接网络示例：

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(784, 256)  # 输入层到隐藏层
        self.fc2 = nn.Linear(256, 10)   # 隐藏层到输出层
    
    def forward(self, x):
        x = x.view(-1, 784)  # 展平输入
        x = F.relu(self.fc1(x))  # 激活函数
        x = self.fc2(x)
        return x

net = Net()
print(net)

模型训练流程

一个完整的PyTorch训练流程通常包括以下步骤：

数据准备
模型定义
损失函数和优化器选择
训练循环
模型评估

import torch.optim as optim

# 定义损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.01)

# 训练循环
for epoch in range(10):  # 训练10轮
    running_loss = 0.0
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data
        
        # 梯度清零
        optimizer.zero_grad()
        
        # 前向传播+反向传播+优化
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        
        # 打印统计信息
        running_loss += loss.item()
    print(f'Epoch {epoch+1}, loss: {running_loss/2000:.3f}')

GPU加速

PyTorch可以轻松地将计算转移到GPU上：

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# 将模型转移到GPU
net.to(device)

# 将数据转移到GPU
inputs, labels = inputs.to(device), labels.to(device)