pytorch构建自己数据集合

这篇博客介绍了如何在PyTorch中构建自己的数据集,包括数据处理类的创建、数据转换为Tensor、数据集划分,为机器学习模型的训练和测试提供准备。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

使用pytorch构建自己的训练和测试数据集合,涉及自己数据处理类,数据变为tensor,数据分割等,为后续的训练准备了训练数据和测试数据
 

import torch
from torch.utils.data import DataLoader, Dataset,TensorDataset,random_split
import sys


class label_featureDataSet(Dataset):
    def __init__(self,filename):
       self.filename = filename
       content_list = []
       with open(filename) as f:
           for line in f:
               line = line.strip()
               content_list.append(line)
       self.content_info = content_list
     
    def __len__(self):
         return len(self.content_info)

    def __getitem__(self, idx):
        content = self.content_info[idx]
        label, feature = content.split("\t")
        label = int(label)
        feature_list = feature.split(",")
        result_feature = []
        for ele in feature_list:
            result_feature.append(float(ele))
        return {"feature":result_feature,"label":label}


if __name__ == '__main__':
    filename
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值