使用深度神经网络处理时间序列数据
1. 数据准备
首先,我们创建一个空的 x.data
列表,在 for
循环中调用 Lag
函数获取最后 31 个收盘价。将这个列表与原始数据合并,并去除所有包含 NA
值的行,这样就得到了我们的数据集。
接下来进行训练集和测试集的划分:
- 我们使用整个时间序列数据的 80% 进行训练,剩余 20% 用于测试。
- 划分代码如下:
train.perc = 0.8
train.indx = 1:as.integer(dim(final.data)[1] * train.perc)
train.data <- final.data[train.indx,]
test.data <- final.data[-train.indx ,]
此时, train.data
包含 80% 的数据, test.data
包含最后的 20%。
然后,将数据划分为因变量 y
和自变量 x
:
train.x.data <- data.matrix(train.data[,-1])
train.y.data <- train.data[,1]
test.x.data <- data.matrix(te