文章目录
1. 第一种方法(调用Dataset类,直接加载所有的数据):使用Pytorch的Dataset类来构建数据集,再使用Data.DataLoader()来加载数据集
使用到Pytorch中的:TORCH.UTILS.DATA.DATASET
1. 通过继承Dataset类来构建数据集
from torch.utils.data import Dataset
# TORCH.UTILS.DATA.DATASET
# 1. 图片的路径和标签信息存储在一个txt中
# 2. 将这些信息转化为list,该list每一个元素对应一个样本
# 3. 通过getitem函数,读取数据和标签,并返回数据和标签
class myData(Dataset): # from torch.utils.data import Dataset
def __init__(self):
initDataDir = "initData" # 保存所有数据的路径
self.all_data = [] # 存放所有的数据
files = os.listdir(initDataDir)
for file in files:
df = pd.read_excel(os.path.join(initDataDir, file))
col_names = df.columns.values.tolist() # 获取列的名字
for i in range(0, len(df)): # 遍历每一行的数据
self.all_data.append(