这是在b站刘二大人up主那里的学习笔记,自己整理的些代码:
用sklearn里的糖尿病数据集做的一个逻辑回归预测,跟刘老师教程里的有所不同,我这个的label是几十到四百多的数字,不是离散化的0-1,所以我自己定了个边界值200,小于就设为0,大于就设为1,方便做预测;小白一枚,大佬帮忙指导指导
# diabetes的逻辑回归,用Dataloader和Datasets,并使用mini-batch
import torch
from torch.utils.data import Dataset # Datasets是抽象类,不能实例化只能被子类继承
from torch.utils.data import DataLoader
from sklearn.datasets import load_diabetes
# 准备数据
class DiabetesDatasets(Dataset):
def __init__(self): # 加载数据两种选择:数据量不大时全部加载进内存:如下;数据量大时,定义数据文件名列表(以及标签列表),通过读取列表来读取文件
sets = load_diabetes()
self.x_data = torch.Tensor(sets['data'])
self.y_data = torch.Tensor(sets['target']).view(442, 1)