时间序列机器学习入门:算法与应用解析
1. 时间序列基础与相似性度量
在处理时间序列数据时,我们常常需要比较不同时间序列之间的相似性,这在检索、聚类、预测、回归和分类等任务中有着广泛的应用。那么,如何衡量两个时间序列是否相似呢?
1.1 相关比率
相关比率基于单个类别内的方差和总体的方差。其范围在[0, 1]之间,0 表示类别之间没有关联,1 表示类别之间有绝对的关联。
1.2 时间序列相似性度量方法
- 欧几里得距离 :这是一种通用的距离度量方法,适用于任何向量对,包括时间序列。其计算公式为:$d(x, y) = \sqrt{\sum_{t}(x_t - y_t)^2}$。不过,在实际应用中,对于时间序列,我们可以通过将时间序列进行快速傅里叶变换到频域后再计算欧几里得距离,以获得更好的效果。
- 动态时间规整(DTW) :它是一种用于测量两个时间序列之间相似性的算法,能够处理时间序列中事件的时间位置和持续时间的变化。DTW 本质上是一种编辑距离,它表示将一个序列转换为另一个序列的成本。DTW 已被应用于自动语音识别,但它在量化不匹配序列之间的差异方面存在不足。DTW 可以独立应用于每个特征维度,然后将距离相加;也可以通过计算所有维度上两点之间的欧几里得距离,同时对所有特征进行规整,这就是依赖规整(DTW - D),是一种多变量方法。
- 格兰杰因果关系 :用于确定一个时间序列是否有助于预测另一个时间序列。虽然该度量中的真正因果关系存在争议,但它考虑了一个序列的值在时间上
超级会员免费看
订阅专栏 解锁全文
1625

被折叠的 条评论
为什么被折叠?



