1d-SAX与LEMAIO:时间序列处理与活动建模的创新方法
在数据处理与分析领域,时间序列数据的处理和活动模型的学习一直是重要的研究方向。本文将详细介绍两种创新的方法:1d - SAX(一种新颖的时间序列符号表示方法)和LEMAIO(学习涉及交互对象的活动模型的多层框架),并通过实验结果展示它们的性能和优势。
1d - SAX:时间序列的新颖符号表示
1d - SAX方法基于时间序列在子段上的线性回归量化,符号考虑了时间序列的平均值和斜率信息。与SAX表示相比,在相同数量的符号下,它所需的信息数量相同,但能更好地拟合原始时间序列,减少了符号化带来的近似误差。
1. 时间序列表示与近似
通过对时间序列进行量化,可以提取表示线性回归量化平均值和斜率值的二进制单词。从这些区间中取中位数,可以得到线性回归平均值和斜率值的近似值,进而从量化版本中获得时间序列的数值近似。
例如,图3展示了一个时间序列及其SAX和1d - SAX表示,使用64个量化级别,1d - SAX对平均值使用16个级别,对斜率值使用4个级别。可以看出,1d - SAX表示比SAX表示更准确地拟合时间序列。
2. 非对称查询在时间序列数据库搜索中的应用
将1d - SAX应用于1 - 最近邻搜索(1 - NNS)问题,提出了一种非对称查询方法,以避免双重量化误差。具体步骤如下:
1. 将查询q分割成长度为L的段:q = q1, …, qw
2. 计算q的每个段与符号sj(1 ≤ j ≤ N)之间的欧几里得距离,并将这些距离放入维度为w × N的查找表A = (ai,j)中,其中ai,j = ED(qi, sj)²
超级会员免费看
订阅专栏 解锁全文
626

被折叠的 条评论
为什么被折叠?



