10、PyTorch教程---加载数据

PyTorch数据加载指南

最新推荐文章于 2023-10-14 12:37:03 发布

Knowledgebase

最新推荐文章于 2023-10-14 12:37:03 发布

阅读量263

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch保姆级教程文章标签： pytorch 人工智能 python 深度学习机器学习

本文链接：https://blog.youkuaiyun.com/Knowledgebase/article/details/133309917

PyTorch保姆级教程专栏收录该内容

21 篇文章 ¥19.90 ¥99.00

订阅专栏

本文介绍了PyTorch中用于加载和准备数据的torchvision包，重点讲解了Dataset和DataLoader的使用。Dataset用于从数据集中读取和转换数据点，而DataLoader则负责数据的随机排列和批量处理，可以配合多进程工作器并行加载数据。通过实例展示了如何使用Pandas加载CSV文件，文件包含图像名称和68个标记点的x、y坐标信息。

PyTorch包括一个名为torchvision的包，用于加载和准备数据集。它包括两个基本函数，即Dataset和DataLoader，用于数据集的转换和加载。

**Dataset（数据集）**
数据集用于从给定的数据集中读取和转换数据点。实现的基本语法如下所示：

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)

**DataLoader（数据加载器）**
DataLoader用于对数据进行随机排列和分批处理。它可以与多进程工作器一起并行加载数据。

trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2)

示例：加载CSV文件
我们使用Python包Pandas来加载CSV文件。原始文件具有以下格式：（图像名称，68个标记点 - 每个标记点有x、y坐标）。

landmarks_frame = pd.read_csv('faces/face_landmarks.csv')

n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].va

了解本专栏