股票市场预测与分布式计算训练机器学习模型
1. 股票市场预测模型
在股票市场预测领域,有两种常见的模型:随机森林(Random Forest)和循环神经网络(RNN)。
1.1 数据划分
对于样本量大于等于 400 的股票代码,数据按 70%、10% 和 20% 的比例分别划分为训练集、验证集和测试集;对于样本量小于 400 的股票代码,则按 60%、10% 和 30% 的比例进行划分。
1.2 模型构建
- 随机森林模型 :采用 Bagging 方法构建,具体参数如下:
- 每棵树的最大深度为 20。
- 每棵树的最大叶子数为 21。
- 构建一棵树使用的样本数为 100。
- 信息准则为熵(Entropy)。
- 树的数量为 1000。
- RNN 模型 :输入层有 65 个特征,优化器为随机梯度下降(SGD),包含两个隐藏层,分别有 32 个节点和 16 个节点。
1.3 实验结果
| 股票代码 | 随机森林(训练准确率) | 随机森林(准确率 %) | 随机森林(F1 分数 %) | RNN(训练准确率) | RNN(准确率 %) |
|---|
股票预测与分布式模型训练
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



