深度学习模型构建与应用:RNN、自编码器与Google BigQuery
1. RNN与多变量时间序列分析
1.1 数据集与问题定义
使用道琼斯指数数据集,该数据集来自著名的UCI机器学习库。此股票数据集中,每行包含一周的股票价格记录,以及该股票下周的回报率。以美国银行(BAC)股票为例,利用前一周的记录来预测接下来两周的价格百分比变化。
1.2 数据预处理
- 数据清理 :使用
clean_dataset()函数,去除特定数据列中的美元符号,删除缺失值,并重新排列数据列,使目标属性percent_change_next_weeks_price成为最后一列。
def clean_dataset(data):
col = ['open', 'high', 'low', 'close', 'next_weeks_open', 'next_weeks_close']
data[col] = data[col].replace({'\$': ""}, regex=True)
data.dropna(inplace=True)
columns = ['quarter', 'stock', 'open', 'high', 'low', 'close', 'volume',
'percent_change_price', 'percent_change_volume_over_last_wk',
超级会员免费看
订阅专栏 解锁全文
977

被折叠的 条评论
为什么被折叠?



