PyTorch深度学习基础：张量入门指南-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_00463/article/details/148391780

PyTorch深度学习基础：张量入门指南

pytorch-deep-learning Materials for the Learn PyTorch for Deep Learning: Zero to Mastery course. 项目地址: https://gitcode.com/gh_mirrors/py/pytorch-deep-learning

什么是PyTorch？

PyTorch是一个开源的机器学习与深度学习框架，由Facebook人工智能研究院(FAIR)开发并维护。它提供了强大的GPU加速计算能力，并且拥有灵活的神经网络构建方式，使得研究人员和开发者能够高效地实现各种深度学习模型。

PyTorch的核心：张量(Tensor)

张量是PyTorch中最基本的数据结构，可以理解为多维数组。在深度学习中，几乎所有数据最终都会被表示为张量形式。理解张量是掌握PyTorch的第一步。

张量的维度

张量可以有不同的维度：

标量(Scalar)：零维张量，表示单个数值
向量(Vector)：一维张量，表示一组数值
矩阵(Matrix)：二维张量，表示表格数据
高阶张量(Tensor)：三维及以上张量，可以表示更复杂的数据结构

创建张量

让我们从基础开始，创建不同类型的张量：

import torch

# 创建标量
scalar = torch.tensor(7)
print(f"标量: {scalar}, 维度: {scalar.ndim}")

# 创建向量
vector = torch.tensor([7, 7])
print(f"向量: {vector}, 维度: {vector.ndim}")

# 创建矩阵
matrix = torch.tensor([[7, 8], [9, 10]])
print(f"矩阵: {matrix}, 维度: {matrix.ndim}")

# 创建三维张量
tensor = torch.tensor([[[1, 2, 3], [3, 6, 9], [2, 4, 5]]])
print(f"三维张量: {tensor}, 维度: {tensor.ndim}")

张量的属性

每个PyTorch张量都有几个重要属性：

shape：描述张量的形状（各维度大小）
dtype：张量中元素的数据类型
device：张量所在的设备（CPU或GPU）

# 查看张量属性
print(f"矩阵形状: {matrix.shape}")
print(f"矩阵数据类型: {matrix.dtype}")
print(f"矩阵所在设备: {matrix.device}")

张量的实际应用

在深度学习中，张量可以表示各种数据：

图像：通常表示为形状为[通道数, 高度, 宽度]的三维张量
文本：可以表示为词嵌入向量的序列
视频：可以表示为形状为[帧数, 通道数, 高度, 宽度]的四维张量

张量操作基础

PyTorch提供了丰富的张量操作函数：

基本数学运算：加减乘除、矩阵乘法等
索引和切片：与NumPy类似的索引方式
形状操作：改变张量形状而不改变数据

# 张量运算示例
a = torch.tensor([1, 2, 3])
b = torch.tensor([4, 5, 6])

# 逐元素相加
print(a + b)

# 矩阵乘法
mat1 = torch.tensor([[1, 2], [3, 4]])
mat2 = torch.tensor([[5, 6], [7, 8]])
print(torch.matmul(mat1, mat2))

# 改变形状
original = torch.arange(1, 10)  # 创建1-9的张量
reshaped = original.reshape(3, 3)  # 改为3x3矩阵
print(reshaped)

张量与NumPy互操作

PyTorch张量可以方便地与NumPy数组相互转换：

import numpy as np

# 从NumPy数组创建张量
numpy_array = np.array([1, 2, 3])
tensor_from_numpy = torch.from_numpy(numpy_array)

# 从张量创建NumPy数组
tensor = torch.tensor([4, 5, 6])
numpy_from_tensor = tensor.numpy()

GPU加速

PyTorch的一个强大特性是能够利用GPU加速计算：

# 检查GPU是否可用
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"使用设备: {device}")

# 将张量移动到GPU
tensor = torch.tensor([1, 2, 3])
tensor_on_gpu = tensor.to(device)