时间序列论文常用数据集

下载地址:laiguokun/multivariate-time-series-data.

electricity

(行,列) = (26304, 321)

每日的用电量有一定的季节性,图中只画出 10 列
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

exchange_rate

(行,列) = (7588, 8)
在这里插入图片描述

solar-energy

(行,列) = (52560, 137)

太阳能自然是以天为周期算,晚上几乎为零,故呈现如下形状
在这里插入图片描述

tr

### 时间序列预测数据集下载指南 对于时间序列预测的研究和实践,获取高质量的数据集至关重要。以下是几个常用时间序列预测数据集及其下载方式: #### 1. **ETT 数据集** 该数据集由两部分组成:`ETT-small-m1`, `ETT-small-m2` 和其小时级别的变体 `ETT-small-h1`, `ETT-small-h2`[^3]。 - 特点:每个数据集中包含两年的记录,每分钟采样一次 (`m`) 或每小时采样一次 (`h`)。每个数据点有8维特征,包括日期、目标变量(如“油温”)和其他外部负载值。 - 下载地址:通常可以通过论文作者提供的链接或者公开存储库访问这些数据集。例如,在 GitHub 上搜索关键词 “ETT time series dataset”,即可找到官方或社区维护的相关资源。 #### 2. **UCI Machine Learning Repository 中的时间序列数据集** 这是一个广泛使用的机器学习数据集合,其中包含了多个适合时间序列分析的任务。 - 地址:https://archive.ics.uci.edu/ml/datasets.php?format=&task=ts&att=&area=&numAtt=&numIns=&type=&sort=nameUp&view=table - 推荐子集: - **Beijing PM2.5 Data**: 记录北京地区的空气质量指数 (PM2.5),可用于污染水平的趋势预测[^1]。 - **Electricity Load Diagrams**: 提供电力消耗的历史记录,适用于能源需求建模。 #### 3. **M4 Competition Dataset** 这是 Kaggle 平台上举办的一次竞赛所用到的大规模时间序列数据库,涵盖了多种行业领域内的实际应用场景。 - 官网链接:http://www.m4.unic.ac.cy/ - 描述:它总共拥有超过十万条独立的时间序列样本,长度各异,并分为日频、月频等多个频率类别。 #### 4. **Kaggle Time Series Datasets** 作为全球最大的数据分析爱好者交流平台之一,Kaggle 不仅定期发布新的比赛题目及相关资料包,同时也允许个人上传分享自己的作品成果。 - 浏览页面:https://www.kaggle.com/datasets?tags=time-series - 实例列举:“Store Item Demand Forecasting Challenge”, 这个项目旨在通过历史销售情况来推测未来商品库存状况;还有像股票价格走势之类的金融类别的例子也十分常见。 --- ### Python 示例代码片段展示如何加载 CSV 文件形式存在的简单版时间序列数据 假设已经成功从上述任意来源处获得了某特定格式化的 csv 文本文件,则可以用如下所示的方法读取并初步探索一下基本信息: ```python import pandas as pd # 替换 'your_dataset.csv' 成真实的路径名 df = pd.read_csv('your_dataset.csv') print(df.head()) # 查看前几行内容概览 print(df.info()) # 获取列属性详情统计表单 ``` 以上脚本依赖 Pandas 库完成基本操作处理流程演示。 ---
评论 19
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

颹蕭蕭

白嫖?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值