PyTorch包括一个名为torchvision的包,用于加载和准备数据集。它包括两个基本函数,即Dataset和DataLoader,用于数据集的转换和加载。
**Dataset(数据集)**
数据集用于从给定的数据集中读取和转换数据点。实现的基本语法如下所示:
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
**DataLoader(数据加载器)**
DataLoader用于对数据进行随机排列和分批处理。它可以与多进程工作器一起并行加载数据。
trainloader = torch.utils.data.DataLoader(trainset, batch_size=4, shuffle=True, num_workers=2)
示例:加载CSV文件
我们使用Python包Pandas来加载CSV文件。原始文件具有以下格式:(图像名称,68个标记点 - 每个标记点有x、y坐标)。
landmarks_frame = pd.read_csv('faces/face_landmarks.csv')
n = 65
img_name = landmarks_frame.iloc[n, 0]
landmarks = landmarks_frame.iloc[n, 1:].va
PyTorch数据加载指南
本文介绍了PyTorch中用于加载和准备数据的torchvision包,重点讲解了Dataset和DataLoader的使用。Dataset用于从数据集中读取和转换数据点,而DataLoader则负责数据的随机排列和批量处理,可以配合多进程工作器并行加载数据。通过实例展示了如何使用Pandas加载CSV文件,文件包含图像名称和68个标记点的x、y坐标信息。
订阅专栏 解锁全文
1870

被折叠的 条评论
为什么被折叠?



