金融时间序列数据可视化指南
1. 可视化在金融时间序列数据中的重要性
在数据科学领域,“一图胜千言”这句古老的谚语非常适用。对于金融时间序列数据,快速绘制序列图能带来许多有价值的见解,例如:
- 序列是否连续?
- 是否存在意外的缺失值?
- 是否有看起来像异常值的值?
- 是否有可以快速识别并用于进一步分析的模式?
可视化的主要目标是在项目开始时让我们熟悉数据,只有这样,我们才能进行适当的统计分析并构建机器学习模型来预测序列的未来值。
Python 提供了多种用于数据可视化的库,每个库的复杂度(包括学习曲线)和输出质量略有不同。一些最流行的可视化库包括:
- matplotlib
- seaborn
- plotly
- altair
- plotnine(基于 R 的 ggplot,对熟悉 R 的人可能特别有吸引力)
- bokeh
2. 基本的时间序列数据可视化
最常见的时间序列数据可视化起点是简单的折线图,即连接时间序列值(y 轴)随时间(x 轴)变化的线。我们可以使用这个图快速识别数据中的潜在问题,并查看是否有主要模式。
2.1 操作步骤
以下是下载、预处理和绘制微软 2020 年股票价格和收益率序列的步骤:
1. 导入库 :
import pandas as pd
import numpy as np
import yfinance as yf
超级会员免费看
订阅专栏 解锁全文
1076

被折叠的 条评论
为什么被折叠?



