用线性回归预测股票的涨跌

最新推荐文章于 2024-04-10 06:26:37 发布

转载最新推荐文章于 2024-04-10 06:26:37 发布 · 1.4k 阅读

html+js+jquery+css 专栏收录该内容

644 篇文章

订阅专栏

使用20年的上证指数历史数据，通过支持向量机算法预测股市的涨跌情况。采用150天的历史数据作为训练样本，实现对未来股市走势的预测。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

转载于:http://blog.youkuaiyun.com/qq_21046135/article/details/75757531

1、数据介绍

网易财经上获得的上证指数的历史数据，爬取了20年的上证指数数据

2、实验目的

根据给出当前时间前150天的历史数据，预测当天上证指数的涨跌

这里写图片描述

代码：

import pandas as pd
import numpy as np
from sklearn import svm
from sklearn import cross_validation

data=pd.read_csv('000777.csv',encoding='gbk',parse_dates=[0],index_col=0)
data.sort_index(0,ascending=True,inplace=True)

//data.shape[0]-dayfeature意思是因为我们要用150天数据做训练，对于条目为200条的数据，只有50条数 据是有前150天的数据来训练的，所以训练集的大小就是200-150， 对于每一条数据，他的特征是前150 天的所有特征数据，即150*5，+1是将当天的开盘价引入作为一条特征数据

dayfeature=150
featurenum=5*dayfeature
x=np.zeros((data.shape[0]-dayfeature,featurenum+1))
y=np.zeros((data.shape[0]-dayfeature))


for i in range(0,data.shape[0]-dayfeature):
    x[i,0:featurenum]=np.array(data[i:i+dayfeature] \
          [[u'收盘价',u'最高价',u'最低价',u'开盘价',u'成交量']]).reshape((1,featurenum))

    //最后一列记录当日的开盘价
    x[i,featurenum]=data.ix[i+dayfeature][u'开盘价']

for i in range(0,data.shape[0]-dayfeature):
    if data.ix[i+dayfeature][u'收盘价'] >= data.ix[i+dayfeature][u'开盘价']:
    //如果当天收盘价高于开盘价，y[i]=1代表涨，0代表跌
        y[i]=1
    else:
        y[i]=0          

clf=svm.SVC(kernel='sigmoid')
result = []
for i in range(5):
    x_train, x_test, y_train, y_test = \
                cross_validation.train_test_split(x, y, test_size = 0.2)
    clf.fit(x_train, y_train)
    result.append(np.mean(y_test == clf.predict(x_test)))
print("svm classifier accuacy:")
print(result)

输出：

svm classifier accuacy:
[0.51465798045602607, 0.51682953311617807, 0.55700325732899025, 0.56026058631921827, 0.55483170466883824]

用 线性回归 预测股票的涨跌

用线性回归预测股票的涨跌