时空模式挖掘与图模式挖掘技术解析
在数据挖掘领域,时空模式挖掘和图模式挖掘是两个重要的研究方向,它们在众多实际应用中发挥着关键作用。下面将详细介绍这两个领域的相关技术和方法。
时空模式挖掘 - 轨迹聚类
轨迹聚类与移动对象聚类有所不同。移动对象聚类主要检测对象的聚类以及它们在一起的相应时间间隔,而轨迹聚类则是基于整体轨迹相似度对(子)轨迹进行分组。例如,移动对象聚类适合解决“找出一起停留超过 2 小时的一群人”这类问题,而轨迹聚类可以回答“根据轨迹相似度对多年来的飓风路径进行分组”等问题。
典型的聚类框架需要考虑两个因素:
1. 相似度度量 :常见的两条轨迹之间的相似度度量方法包括欧几里得距离、动态时间规整和最长公共子序列。
2. 聚类方法 :典型的聚类方法有 K - 均值、层次聚类和高斯混合模型。
Gaffney 和 Smyth 提出基于轨迹的概率建模来对轨迹进行聚类。在概率聚类中,假设数据以以下“生成”方式产生:
- 从感兴趣的总体中随机抽取一个个体。
- 该个体以概率 $w_k$ 被分配到聚类 $k$,其中 $\sum_{k = 1}^{K} w_k = 1$,这些是 $K$ 个聚类的先验权重。
- 给定个体属于聚类 $k$,存在一个密度函数 $f_k(y_j|\theta_k)$ 为个体 $j$ 生成观测数据 $y_i$。
从这个生成模型来看,$y$ 的观测密度应该是一个混合模型,即组件模型的线性组合:
$P(y_j|\theta) = \sum_{k} f_k(y_j|\theta_k)w_k$
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



