时间序列分析入门指南
1. 技术要求
在开始时间序列分析之前,需要在机器上安装 Python 3.9,并使用以下库:
- pandas (2.1.4)
- numpy (1.26.3)
- statsmodels (0.14.1)
- pmdarima (2.0.4)
- seaborn (0.13.2)
可以使用以下命令通过 pip 安装这些库:
pip install pandas numpy statsmodels pmdarima seaborn
在本环境中,使用的 pip 版本为 23.3.1。相关代码可在以下 GitHub 链接找到:https://github.com/PacktPublishing/Deep-Learning-for-Time-Series-Data-Cookbook
2. 使用 pandas 加载时间序列
我们将使用美国农业部收集的太阳能辐射数据集,该数据集记录了从 2007 年 10 月 1 日到 2013 年 10 月 1 日的太阳能辐射信息(单位:瓦/平方米),以每小时的频率收集,共有 52,608 个观测值。可以从技术要求部分提供的 GitHub 链接下载该数据集,原始数据源为:https://catalog.data.gov/dataset/data-from-weather-snow-and-streamflow-data-from-four-western-juniper-dominated-experimenta-b9e22 。
超级会员免费看
订阅专栏 解锁全文
1630

被折叠的 条评论
为什么被折叠?



