pytorch中使用Dataset、DataLoader读取自定义数据集

首先需要导入库文件
from torch.utils.data import Dataset, DataLoader

1、读取数据和标签

将数据和标签分别进行读入。

2、转换成 tensor

pytorch处理tensor,对于其他类型数据需要进行转换,如将numpy.ndarray转换为tensor类型可用函数:torch.from_numpy函数

3、定义init()和getitem() 和len() 函数

定义类CreateDataset,需要继承Dataset类。

class CreateDataset(Dataset):#需要继承data.Dataset
def __init__(self):
    # TODO
    # 1. Initialize file path or list of file names.
    pass
def __getitem__(self, index):
    # TODO
    # 1. Read one data from file (e.g. using numpy.fromfile, PIL.Image.open).
    # 2. Preprocess the data (e.g. torchvision.Transform).
    # 3. Return a data pair (e.g. image and label).
    #这里需要注意的是,第一步:read one data,是一个data
    pass
def __len__(self):
    # You should change 0 to the total size of your dataset.
    return 0

4、初始化类

实例化类CreateDataset

train_data =  CreateDataset()

5、将类实例传给 DataLoader

trainloader = DataLoader(train_data, batch_size = 10, shuffle = False)

参考链接:
https://www.pytorchtutorial.com/pytorch-note4-input-data-pipeline/
自定义数据集例程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

执着且专注

予人玫瑰,手有余香

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值