时间序列数据处理与分类方法研究
时间序列数据在各个领域都极为丰富,但因其规模大、维度高,给存储和处理带来了挑战。本文将介绍两种应对这些挑战的方法:IncMSTS - PP算法用于环境传感器数据中重要序列的提取,DSCo方法用于时间序列分类。
IncMSTS - PP算法实验与结果
为了验证IncMSTS - PP方法,研究人员进行了多项实验,使用的数据来自巴西圣保罗州圣卡洛斯市费若河安装的环境传感器,涵盖1977年至2004年的河流流量和降雨量数据,数据按天记录并按采集地理位置排序。
- 数据预处理
- 为使用IncMSTS - PP,数据集需经过预处理步骤,采用Omega算法对数据进行离散化,这与之前的研究方法相同。
- 以下是原始数据和经过Omega算法处理后的数据示例:
| 表1. 费若河原始数据库中的元组示例 | 日期 | 流量(立方米/秒) | 降雨量(毫米/小时) |
| — | — | — | — |
| | 1979.03.19 | 2.41 | 1.2 |
| | 1979.03.10 | 2.25 | 0 |
| | 1979.03.21 | 2.1 | 0.6 |
| | 1979.03.22 | 3.68 | 22.5 |
| 表2. 经过Omega算法处理后的相同元组 | 元组 | 降雨量 | 流量 |
|---|
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



