项目目的是通过股票的历史行情价格来预测未来某只股票的涨跌,问题本身其实就是二分类问题,数据是通过tushare
库来获取到的。
- 根据已经给定的数据,构造出样本数据。
- 提取完技术指标之后,做一些简单的数据处理
- 构造训练数据和测试数据
- 利用随机森立学习二分类器
# 导入相应的函数库
import pandas as pd
import datetime
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import f1_score
import matplotlib.pyplot as plt
# 技术指标的提取函数
from technical_indicators import *
# 导入股票数据,下面的股票数据是通过tushare库来获得的
stock = pd.read_csv("600519.csv")
stock.head(10)
1. 对于股票数据提取技术指标
直接调用给定的技术指标库来获得这些数据。 如果对某一种指标感兴趣,想深入理解建议在百度上搜索 : “技术指标” + “指标名字”来获得相关的参考资料,比如搜索 “技术指标” + 'rate of change", 有大量的资料可以参考的。
# 提取各类技术指标, 你可以把所有的技术指标全部调用一遍,也可以选择几个来尝试。 或者感兴趣的话,可以把其他的技术指标也加进来。