动态时间规整与隐马尔可夫模型结合的时间序列聚类方法
1. 动态时间规整(DTW)基础
在处理时间序列时,由于不能将其嵌入到度量空间,DTW提供了一种结合的方法。首先,在给定的聚类中选择与所有其他时间序列距离最小的时间序列,然后将其他模式规整到这个质心,使所有模式处于同一时间尺度。最后,计算所有序列在每个时间点的平均值,并将结果作为聚类原型。
2. DTW的严格讨论
更正式地描述DTW有两个原因:一是为了明确维特比算法和DTW之间的相似性,二是给出DTW更常规的解释。通常使用点之间欧几里得距离的和(规整后)作为要最小化的度量。
设 $W$ 和 $Y$ 分别是长度为 $L_W$ 和 $L_Y$ 的多变量实值时间序列:
$W = w_1w_2 \cdots w_{L_W}$
$Y = y_1y_2 \cdots y_{L_Y}$
给定 $t_y \in {1, 2, \cdots, L_Y}$ 和 $t_w \in {1, 2, \cdots, L_W}$,设 $\varphi$ 是一个规整函数,将 $W$ 的元素映射到 $Y$ 的元素:
$\varphi(t_w) = t_y$
设 $d$ 是一个距离度量,如欧几里得距离。DTW使用动态规划来确定 $\varphi$,使得以下和最小化:
$D_{\varphi} = \sum_{t_w = 1}^{L_W} d(w_{t_w}, y_{\varphi(t_w)})$
当 $d$ 计算平方差,且 $W$ 和 $Y$ 是单变量时:
$D_{\varphi} = \sum_{t_w = 1}^{L_W} (w