干货!手把手教你利用 LSTM 模型预测亚马逊股票价格

机器学习是指一套工具或方法,凭借这套工具和方法,利用历史数据对机器进行"训练"进而"学习"到某种模式或规律,并建立预测未来结果的模型。
在这里插入图片描述

机器学习涉及两类学习方法(如上图):有监督学习,主要用于决策支持,它利用有标识的历史数据进行训练,以实现对新数据的标识的预测。无监督学习方法主要包括聚类。

在日常工作中,预测(回归)是我们经常用到的场景。今天我将手把手分享一个实战项目:如何使用长期记忆(LSTM)预测股票价格。

LSTM模型

长短期记忆(LSTM)是一种在具有反馈连接的循环神经网络架构。不仅可以处理单个数据点(例如图像),还可以处理整个数据序列(例如语音或视频)。例如,LSTM适用于诸如未分段,连接的手写识别,语音识别,机器翻译,异常检测,时间序列分析等任务。
在这里插入图片描述

LSTM模型的计算量很大,并且需要许多数据。通常,我们使用GPU而不是CPU来训练LSTM模型。Tensorflow是用于训练LSTM模型的强大库。

LSTM股票价格模型

获取数据

我们将建立一个 LSTM 模型来预测小时股票价格。首先需要加载数据:以亚马逊(AMZN) 股票为例,时间考虑到从’2019–06–01’至’2021–01–07’的每小时收盘价。

import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
data=yf.download('AMZN',start='2019-06-01', interval='1h',  end='2021-01-07',progress=False)[['Close']]
data.head()
 
data.plot(figsize=(10,10))

在这里插入图片描述

准备数据

训练数据将具有回溯值作为特征,滞后值为"lb"。对于此示例,我们将lb设置为10。在此示例中,我们将前90%的观测值保留为训练数据集,其余10%作为测试数据集。

from sklearn.preprocessing import MinMaxScaler
cl = data.Close.astype('float32')
train = cl[0:int(len(cl)*0.90)]
scl = MinMaxScaler()
#Scale the data
scl.fit(train.values.reshape(-1,1))
cl =scl.transform(cl.values.reshape(-1,1))
#Create a function to process the data into lb observations look back slices
# and create the train test dataset (90-10)
def processData(data,lb):
    X,Y = [],[]
    for i in range(len(data)-lb-1):
        X.append(data[i:(i+lb),0])
        Y.append(data[(i+lb),0])
    return np.array(X),np.array(Y)
lb=10
X,y = processData(cl,lb)
X_train,X_test = X[:int(X.shape[0]*0.90)],X[int(X.shape[0]*0.90):]
y_train,y_test = y[:int(y.shape[0]*0.90)],y[int(y.shape[0]*0.90):]
print(X_train.shape[0],X_train.shape[1])
print(X_test.shape[0],X_test.shape[1])
print(y_train.shape[0])
print(y_test.shape[0])
建立LSTM模型
from keras.layers import LSTM,Dense, Dropout, BatchNormalization
import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
#Build the model
model = Sequential()
model.add(LSTM(256,input_shape=(lb,1)))
model.add(Dense(1))
model.compile(optimizer='adam',loss='mse')
#Reshape data for (Sample,Timestep,Features) 
X_train = X_train.reshape((X_train.shape[0],X_train.shape[1],1))
X_test = X_test.reshape((X_test.shape[0],X_test.shape[1],1))
#Fit model with history to check for overfitting
history = model.fit(X_train,y_train,epochs=300,validation_data=(X_test,y_test),shuffle=False)
model.summary()
预测
plt.figure(figsize =(12,8))
Xt = model.predict(X_train)
plt.plot(scl.inverse_transform(y_train.reshape(-1,1)),label ="Actual")
plt.plot(scl.inverse_transform(Xt),label ="Predicted")
plt.legend()
plt.title("Train Dataset")

在这里插入图片描述

测试
plt.figure(figsize =(12,8))
Xt = model.predict(X_test)
plt.plot(scl.inverse_transform(y_test.reshape(-1,1)),label ="Actual")
plt.plot(scl .inverse_transform(Xt),label ="Predicted")
plt.legend()
plt.title("测试数据集")

在这里插入图片描述

评论

该模型可以在训练数据集上完美运行,而在测试数据集上也非常出色。该模型预测单个观测值。在现实场景中,如果我们想预测未来多个预测值,只需调整一下代码即可!

技术交流

欢迎转载、收藏本文,码字不易,有所收获点赞支持一下!

为方便进行学习交流,本号开通了技术交流群,添加方式如下:

直接添加小助手微信号:pythoner666,备注:优快云+python,或者按照如下方式添加均可!
在这里插入图片描述

根据提供的引用内容,我们可以了解到使用LSTM模型预测股票价格需要进行以下步骤: 1. 获取数据:从数据源获取亚马逊股票价格的历史数据。 2. 准备数据:将数据进行预处理,包括归一化、划分训练集和测试集等。 3. 建立LSTM模型:使用Tensorflow建立LSTM模型,包括定义模型结构、设置超参数、编译模型等。 4. 训练模型:使用训练集对LSTM模型进行训练。 5. 预测测试:使用测试集对训练好的LSTM模型进行预测,并评估模型的性能。 下面是一个简单的LSTM模型预测亚马逊股票价格的示例代码: ```python import numpy as np import pandas as pd import tensorflow as tf from sklearn.preprocessing import MinMaxScaler # 获取数据 data = pd.read_csv('amazon_stock.csv') data = data['Close'].values.reshape(-1, 1) # 准备数据 scaler = MinMaxScaler() data = scaler.fit_transform(data) train_size = int(len(data) * 0.7) train_data = data[:train_size, :] test_data = data[train_size:, :] def create_dataset(dataset, look_back=1): X, Y = [], [] for i in range(len(dataset) - look_back): X.append(dataset[i:(i + look_back), 0]) Y.append(dataset[i + look_back, 0]) return np.array(X), np.array(Y) look_back = 60 train_X, train_Y = create_dataset(train_data, look_back) test_X, test_Y = create_dataset(test_data, look_back) train_X = np.reshape(train_X, (train_X.shape[0], train_X.shape[1], 1)) test_X = np.reshape(test_X, (test_X.shape[0], test_X.shape[1], 1)) # 建立LSTM模型 model = tf.keras.Sequential() model.add(tf.keras.layers.LSTM(units=50, return_sequences=True, input_shape=(train_X.shape[1], 1))) model.add(tf.keras.layers.Dropout(0.2)) model.add(tf.keras.layers.LSTM(units=50)) model.add(tf.keras.layers.Dropout(0.2)) model.add(tf.keras.layers.Dense(units=1)) model.compile(optimizer='adam', loss='mean_squared_error') # 训练模型 model.fit(train_X, train_Y, epochs=50, batch_size=32) # 预测测试 predicted_price = model.predict(test_X) predicted_price = scaler.inverse_transform(predicted_price) # 评估模型 rmse = np.sqrt(np.mean(((predicted_price - test_Y) ** 2))) print('RMSE:', rmse) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值