根据之前方案呈现的结果,当前存在以下问题:
1、大盘数据较少,共6000多条数据,还需要留一部分做测试集
2、大盘指数波动幅度较小,因此程序自动预测为0时撞上的几率较大
3、网络形式简单,未考虑LSTM网络
综上进行方案优化:
1、使用上证市场的所有股票数据进行学习,股票数据加上当日大盘数据作为样本
2、股票涨跌幅度应该是符合正态分布的,故对标签的分配重新划分,相对0成对称划分,且越靠近0处划分区域越小,以使标签落到每个区域的概率尽量平均
3、使用LSTM网络进行学习,考虑时间的影响
难点:上证市场有几千只股票,每个股票的数据也只有几千条,单独开来数据也不足,考虑合起来作为一个模型,但多种数据合并与LSTM网络的适配存在难疑难点,待解决。