时间序列数据挖掘:基于马尔可夫链的创新方法
在当今的数据驱动时代,从海量数据中挖掘有价值的信息变得至关重要。本文将深入探讨两种数据挖掘技术,一是区间时间序列挖掘,二是基于马尔可夫链的事件时间序列行为模式挖掘,并结合大学辍学问题的案例研究,展示这些技术的实际应用。
区间时间序列挖掘
传统的时间序列数据挖掘技术已经得到了广泛的发展,但对于区间时间序列,现有技术并不适用。区间时间序列中的事件在一段时间内是“活跃”的,每个事件都有起始和结束点,因此其包含关系与简单的先后发生关系具有不同的语义。
为了解决这一问题,研究人员提出了一种新的区间时间序列挖掘算法。为了评估该技术的有效性,研究人员在从运行在Oracle数据库上的应用程序获取的系统性能跟踪数据上运行了该挖掘算法。
传统上,电子表格和OLAP(在线分析处理)工具用于可视化性能数据,但这种方法要求用户是专家,并且需要对要探索的内容有一定的了解,容易遗漏一些意外的交互、行为和异常。而新的数据挖掘工具能够自动发现许多有趣的结果。
为了使该技术更具通用性,研究人员还提出了一种量化技术,将传统时间序列数据转换为区间事件时间序列,然后使用所提出的方法进行挖掘。以下是相关实验数据:
| CPU时间(秒) | 事件数量 |
| ---- | ---- |
| 40 | 178 |
| 104 | 286 |
| 367 | 335 |
| 543 | 387 |
基于马尔可夫链的事件时间序列行为模式挖掘
数据挖掘是知识发现数据库(KDD)过程的核心活动,旨在从大量数据中提取隐藏信息。当时间是表征可用信息的重要
超级会员免费看
订阅专栏 解锁全文
776

被折叠的 条评论
为什么被折叠?



