本文来源公众号“kaggle竞赛宝典”,仅用于学术分享,侵权删,干货满满。
原文链接:量化竞赛第一名的网络模型
1 简介
今天我们重温Jane Street 大赛第一名的网络模型。该次赛事数据集包含了一组匿名的特征,feature_{0...129},代表真实的股市数据。数据集中的每一行代表一个交易机会,你需要预测一个动作值:1表示进行交易,0表示放弃。每笔交易都有一个相关的权重和响应,它们一起代表交易的回报。日期列是一个整数,表示交易的日期,而ts_id表示时间顺序。
该赛事的第一名选手采用的是AutoEncoder+MLP的网络模型。一起回顾学习一下。
2 模型
2.1 模型结构
模型主要由三个模块组成:
-
加入高斯噪音的Autoencoder模块;
-
Decoder之后数据的原始Loss;
-
原始数据+Encoder数据的原始问题的Loss;
2.2 相关细节
-
使用自编码器创建新特征,并与原始特征连接,作为下游MLP模型的输入