LSTM预测股票

这篇博客介绍了一个基于LSTM的时间序列预测模型,用于预测股票价格。通过导入numpy、pandas、matplotlib等库,结合tushare获取股票数据,并使用Keras构建LSTM神经网络。文章提供了数据预处理、模型构建、训练及预测结果的可视化过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【深度学习】基于LSTM时间序列的股票价格预测_myaijarvis的博客-优快云博客_lstm预测股价

股票数据

链接:https://pan.baidu.com/s/1rUFUOTPV9JzwZwiIUFtyXw?pwd=1166 
提取码:1166 
--来自百度网盘超级会员V8的分享

000001SZ_10Y.csv

 

import numpy as np
import tushare as t1
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import StandardScaler
from keras.models import Sequential
from keras.layers import Dense, LSTM, Dropout, GRU
from tensorflow.keras.optimizers import SGD # 可以忽略警告错误

#st=StandardScaler()
#t1.set_token('8fa17c450ce70d9d2997013997afaf7502c643095e3f3ebfe1c31525')
#ts = t1.pro_api()



def data_set(dataset, lookback):
   """
   :param dataset: ndarray
   :param lookback: 单个序列的长度
   :return:
   """
   dataX, dataY = [], []
   for i in range(0, len(dataset) - lookback - 1):
      temp = dataset[i: i + lookback]  # 前 lookback步
      dataX.append(temp)
      dataY.append(dataset[i + lookback])  # 第 lookback步
   return np.array(dataX), np.array(dataY)


def plot_predictions(test_result, predict_restult):
   """
   test_result: 真实值
   predict_result: 预测值
   """
   plt.plot(test_result, color='red', label='test')
   plt.plot(predict_restult, color='blue', label="prdict")
   plt.xlabel("Time")
   plt.ylabel("Close Price")
   plt.legend()  # 给图加上图例
   plt.show()



# Press the green button in the gutter to run the script.
if __name__ == '__main__':
   data = pd.read_csv('000001SZ_10Y.CSV')
   df = pd.DataFrame(data,columns=['trade_date','close'])
   df.head(5)
   print(df)
   plt.plot(df['trade_date'], df['close'])
   plt.show()
   dataset = df["close"].values
   print(dataset)
   dataset_st = st.fit_transform(X=dataset.reshape(-1, 1))
   print(dataset_st)
   print(dataset_st.shape)
   train_size = int(len(dataset_st) * 0.7)
   test_size = int(len(dataset_st)) - train_size
   print(train_size)
   print(test_size)
   train, test = dataset_st[0:train_size], dataset_st[train_size:]
   print(train.shape)

   lookback = 2
   trainX, trainY = data_set(train, lookback)
   testX, testY = data_set(test, lookback)
   print(trainX.shape)
   print(trainY.shape)
   print(testX.shape)


   model = Sequential()
   # LSTM 第一层
   model.add(LSTM(128, return_sequences=True,  # 是返回输出序列中的最后一个输出,还是全部序列True。
                  input_shape=(trainX.shape[1], 1)))  # (sequence_length, features)
   model.add(Dropout(0.2))

   # LSTM 第二层
   model.add(LSTM(128, return_sequences=True))
   model.add(Dropout(0.2))

   # LSTM 第三层
   model.add(LSTM(128))
   model.add(Dropout(0.2))

   # Dense层
   model.add(Dense(units=1))

   # 模型编译
   model.compile(optimizer='rmsprop', loss='mse')

   # 模型训练
   model.fit(trainX, trainY, epochs=20, batch_size=32)

   pred_st = model.predict(testX)
   pred = st.inverse_transform(pred_st)  # 进行反归一化
   testY2 = st.inverse_transform(testY)  # 进行反归一化 因为前面进行了归一化
   plot_predictions(testY2, pred)  # 画出图像

# See PyCharm help at https://www.jetbrains.com/help/pycharm/
### 使用LSTM模型预测股票价格 #### 数据准备 在进行股票价格预测之前,需要先加载并预处理数据。通常情况下,可以从Yahoo Finance或其他金融网站获取历史股票数据。这些数据可能包括开盘价、收盘价、最高价、最低价以及交易量等字段。 为了使模型能够更好地学习时间序列中的模式,可以采用标准化方法对原始数据进行缩放处理[^3]: ```python scaler = StandardScaler() scaled_data = scaler.fit_transform(data['Close'].values.reshape(-1, 1)) ``` 接着将数据划分为训练集和测试集,并进一步将其转换成适合输入到LSTM网络的形式[^4]: ```python class StockDataset(Dataset): def __init__(self, data, seq_len=60): self.seq_len = seq_len self.data = [] for i in range(len(data)-seq_len): self.data.append(data[i:i+seq_len]) def __len__(self): return len(self.data) def __getitem__(self, idx): x = torch.tensor(self.data[idx], dtype=torch.float32).unsqueeze(2) y = torch.tensor(scaled_data[idx+self.seq_len], dtype=torch.float32) return x, y train_dataset = StockDataset(train_data) test_dataset = StockDataset(test_data) train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True) test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False) ``` #### 构建LSTM模型 定义一个简单的LSTM结构用于回归任务。此模型接收过去一段时间内的股价作为输入,并尝试预测下一个时刻的价格[^1]。 ```python class LSTMModel(nn.Module): def __init__(self, input_dim, hidden_dim, layer_dim, output_dim): super(LSTMModel, self).__init__() self.hidden_dim = hidden_dim self.layer_dim = layer_dim self.lstm = nn.LSTM(input_dim, hidden_dim, layer_dim, batch_first=True) self.fc = nn.Linear(hidden_dim, output_dim) def forward(self, x): h0 = torch.zeros(self.layer_dim, x.size(0), self.hidden_dim).requires_grad_() c0 = torch.zeros(self.layer_dim, x.size(0), self.hidden_dim).requires_grad_() out, (hn, cn) = self.lstm(x, (h0.detach(), c0.detach())) out = self.fc(out[:, -1, :]) return out ``` 初始化超参数及实例化上述类对象之后即可开始训练过程。 #### 训练与评估 设定损失函数为均方误差(MSE),并通过Adam优化器更新权重值以最小化该目标函数。 ```python model = LSTMModel(input_dim=input_dim, hidden_dim=hidden_dim, layer_dim=layer_dim, output_dim=output_dim) criterion = nn.MSELoss() optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate) for epoch in range(num_epochs): model.train() running_loss = 0 for inputs, labels in train_loader: optimizer.zero_grad() outputs = model(inputs) loss = criterion(outputs.squeeze(), labels) loss.backward() optimizer.step() running_loss += loss.item() * inputs.size(0) avg_train_loss = running_loss / len(train_loader.dataset) print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {avg_train_loss:.8f}') ``` 完成训练阶段后,在验证集合上检验性能指标是否达到预期标准。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值