题目
现有一个csv关于2012-2018的股票交易数据文件,有五列数据:开盘价,最高价,最低价,收盘价,成交量,现在训练一个逻辑回归,预测判断次日的股市升还是降。
示例 csv文件下载:https://github.com/JintuZheng/Blog-/blob/master/FB.csv
数据示例:

导入准备
import pandas as pd
import torch
import torch.nn
import torch.optim
from debug import ptf_tensor
数据读取
(1)从CSV文件来
从csv文件读取数据,我们使用Pandas包。
打开文件,并选中所有的数据:
url = 'C:/Users/HUAWEI/Desktop/深度学习/Blog附带代码/FB.csv'
df = pd.read_csv(url, index_col=0) #读取全部数据
附带:read_csv()用法:
index_col = ['col_1','col_2'] # 读取指定的几列
error_bad_lines = False # 当某行数据有问题时,不报错,直接跳过,处理脏数据时使用
na_values = 'NULL' # 将NULL识别为空值
(2)数据预处理
#数据集的处理
'''
因为数据是日期新的占index靠前
'''
train_start, train_end=sum(df.index>='2017'),sum(df.index>='2013')
test_start, test_end=sum(df.index>='2018'),sum(df.index>='2017')
n_total_train = train_end -train_start
n_total_test = test_end -test_start
s_mean=df[train_start:train_end].mean() #计算均值,为归一化做准备
s_std=df[train_start:train_end].std() # 计算标准差,为归一化做准备

本文介绍了一个使用逻辑回归预测股市涨跌的模型,通过处理2012-2018年的股票交易数据,包括开盘价、最高价、最低价、收盘价和成交量,实现了对次日股市变化的预测。
最低0.47元/天 解锁文章
1828

被折叠的 条评论
为什么被折叠?



