区间时间序列挖掘:原理、方法与实验结果
在实际应用中,我们常常会遇到各种各样的事件关联问题。比如在医疗场景中,可能会发现患者身上存在某种细菌,并且这种关联经常出现,同时在这些细菌存在期间,患者的体温可能会短暂超过107华氏度。在工厂环境里,通过分析传感器等数据,也能挖掘出设备行为之间的关系。当一个传感器处于活跃状态(或高于某个阈值)的时间段可视为一个区间事件,在此时间段内其他活跃的传感器与该传感器就存在包含关系。例如,压力释放阀启动的时间区间总是包含在特定传送带移动新部件的时间区间内。
1. 从区间事件序列到包含图
为了更好地分析这些区间事件之间的关系,我们可以将区间事件序列转换为包含图。输入是按时间戳排序的事件端点列表,格式为 <time_stamp, event_id, end_point in {begin,end}, event_type> ,每个区间事件有两个这样的元组,分别表示开始时间和结束时间。通过这种输入格式,只需对输入数据进行一次遍历,就能加载并构建整个图,而且在添加新的包含关系时,无需在图中搜索其位置。输出是一个有向包含图 $G=(V,E)$,其中 $V$ 中的每个节点对应一个单独的区间事件,形式为 <event_id, event_type, begin_time_stamp, end_time_stamp> ,$E$ 中的每条有向边表示一个区间事件包含另一个区间事件。构建的图是传递闭包的,以降低挖掘算法的复杂度。
2. 量化
对于非区间事件形式的数据集,需要进行量化处理。连续变化的数据由于参数可能有无限个不同值,不适合直接进行挖掘,因为可能不存在包含
超级会员免费看
订阅专栏 解锁全文
1628

被折叠的 条评论
为什么被折叠?



