目录
1.特征工程
我们在进行模型搭建之前,需要进行特征工程。
1.1.创建样本集和标签集
def create_new_dataset(dataset,seq_len):
#新建两个空列表,用来存放样本和标签数据
x=[]
y=[]
start=0#开始位置
end=dataset.shape(0)-seq_len#截止位置
#dataset.shape(0)表示样本数
for i in range(start,end):
sample=dataset[i,i+seq_len]
label=dataset[i+seq_len]
x.append(sample)
y.append(label)
return np.array(x),np.array(y)
注:这里的seq_len表示时间窗口大小
1.2.划分训练集和测试集
def split_datatset(X,y,train_ratio=0.8):
#train_ratio训练集和测试集的比例
X_len=len(X)#样本长度
train_data_len=int(X_len*train_ratio)
X_train=X[:X_len*train_ratio]
y_train=y[:X_len*train_ratio]
X_test=X[X_len*train_ratio:]
y_test=y[X_len*train_ratio:]
return X_train,X_test,y_train,y_test
1.3.创建批数据
def create_batch_data(X,