Dataloader类

最新推荐文章于 2024-12-20 15:54:22 发布

沉睡中的主角

最新推荐文章于 2024-12-20 15:54:22 发布

阅读量636

点赞数 2

分类专栏： pytorch 文章标签：联邦学习 pytorch

本文链接：https://blog.youkuaiyun.com/ggj0727/article/details/119385572

版权

pytorch 专栏收录该内容

13 篇文章

订阅专栏

Dataset让我们可以知道数据在什么位置，及数据的的索引对应的数据。

Dataloader相当于加载器，把数据加载到神经网络中

import torchvision

#测试数据集，train设置为false，因为数据集原本是PIL.image类型，但是我们要用的是tesor类型，所以转换一下
from torch.utils.data import DataLoader

test_data = torchvision.datasets.CIFAR10("./data",train=False,transform=torchvision.transforms.ToTensor(),download=True)

#加载测试集
#batch_size=4即每次从test_data中取4个数据集进行打包
test_loader = DataLoader(dataset=test_data,batch_size=4,shuffle=True,num_workers=0,drop_last=False)

#测试数据集中第一张图片及target
img,target = test_data[0]
print(img.shape)
print(target)

#取test_loader中的每一个返回
for data in test_loader:
    imgs,targets = data
    print(imgs.shape)
    print(targets)

运行结果：

修改batch_size

import torchvision

#测试数据集，train设置为false，因为数据集原本是PIL.image类型，但是我们要用的是tesor类型，所以转换一下
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data = torchvision.datasets.CIFAR10("./data",train=False,transform=torchvision.transforms.ToTensor(),download=True)

#加载测试集
#batch_size=64即每次从test_data中取64个数据集进行打包，drop_last=true意思是最后一张不足64个的时候舍弃，false不舍弃
test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=True,num_workers=0,drop_last=False)

#测试数据集中第一张图片及target
img,target = test_data[0]
print(img.shape)
print(target)

writer = SummaryWriter("dataloader")
step = 0
for data in test_loader:
    imgs,targets = data
    # print(imgs.shape)
    # print(targets)
    writer.add_images("test_data",imgs,step)
    step = step +1
writer.close()

运行后想在tensorboard打开，则tenminal执行以下操作：

点击链接：

（注：如果无法打开，则修改一下logdir的路径，改成相对路径/绝对路径）

对shuffle的使用、修改。在每一轮中shuffle=False时读的数据是一样的。改为True时则顺序打乱

import torchvision

#测试数据集，train设置为false，因为数据集原本是PIL.image类型，但是我们要用的是tesor类型，所以转换一下
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter

test_data = torchvision.datasets.CIFAR10("./data",train=False,transform=torchvision.transforms.ToTensor(),download=True)

#加载测试集
#batch_size=64即每次从test_data中取64个数据集进行打包,drop_last=true意思是最后一张不足64个的时候舍弃,
test_loader = DataLoader(dataset=test_data,batch_size=64,shuffle=False,num_workers=0,drop_last=True)

#测试数据集中第一张图片及target
img,target = test_data[0]
print(img.shape)
print(target)

writer = SummaryWriter("dataloader")

for epoch in range(2):
    step = 0
    #epoch=0时，读取数据一遍，epoch=1时又读取一遍。shuffle=False时读的数据是一样的。改为True时顺序打乱
    for data in test_loader:
        imgs,targets = data
        # print(imgs.shape)
        # print(targets)
        writer.add_images("Epoch:{}".format(epoch),imgs,step)
        step = step +1
writer.close()

在tensorboard显示如下：