简介
上一篇文章,我们看了pytorch的进行一次训练的大致流程,这篇文章,我们就来一次小实战。
数据集
公共自行车使用量预测。
训练集中共有10000条样本,预测集中有7000条样本。
数据集下载:http://sofasofa.io/competition.php?id=1
代码
# 公共自行车使用量预测
# 代码用jupyter notebook写的,用pycharm可能要稍微改一下,不过差别不大
import torch
import pandas as pd
import numpy as np
train_data = pd.read_csv("E:\\李宏毅深度学习\\sofa_data\\公共自行车使用量预测\\data\\train.csv")
test_data = pd.read_csv("E:\\李宏毅深度学习\\sofa_data\\公共自行车使用量预测\\data\\test.csv")
# 显示train_data的前五行,可以看看它的大致结构
train_data.head()
# 选出y
train_y = train_data['y']
# 选出除y之外的其他列
train_x = train_data.loc[:,train_data.columns != 'y']
# 去除id这一列,id完全没用
train_x.drop('id', axis=1, inplace=True)
# 查看trian_x每一列的信息
train_x.info()
"""
划分数据,将训练数据分为训练集和验证集
"""
# 0 to 999
# valid_x = train_x[:1000]
# valid_y = train_y[:1000]
# 9000 to 9999
# x = train_x[9000:]
"""训练"""
x_tensor = torch.tensor(train_x[:9000].values, dtype=torch.float32)
y_tensor = torch.tensor(train_y[:9000].values.reshape(-1,