时间序列分类与流形数据回归的创新方法
在数据处理和分析领域,时间序列分类和流形数据回归是两个重要的研究方向。本文将深入探讨DSCo时间序列分类方法、流形数据回归问题以及基于关联规则的案例推理检索策略,为相关领域的研究和应用提供新的思路和方法。
DSCo:时间序列分类的语言建模方法
DSCo是一种用于时间序列分类的创新方法,它基于符号化的时间序列数据构建每类语言模型。通过将测试样本与这些模型进行匹配,能够预测其对应的类别标签。
在语言模型方面,研究发现修剪后的语言模型中,来自原始模型的二元组不到5%,但分类准确率却保持不变。这表明语言模型存在高度冗余,可使用修剪技术减少内存占用并加快分类过程。
从时间和空间复杂度来看,SAX在将实值时间序列转换为PAA再到文本表示时具有线性的时间和空间复杂度。DSCo的语言模型推理步骤对每个训练样本进行常数次处理,并将模型存储到外部存储中,时间和空间复杂度为O(n)。其分类的适应度度量算法的计算复杂度为O(nL²),而基于DTW的度量方法计算复杂度为O(n²),使用LB Keogh下界技术可将其复杂度降低到O(n)。对于完整的分类过程,使用DTW和LB Keogh的1NN方法复杂度为O(mn),而DSCo的复杂度为O(cnL²),其中c为类别数,在大多数情况下c远小于m。在空间复杂度上,DSCo为O(m²n²),与基于形状特征的算法相当。
然而,DSCo也存在一定的局限性。由于它本质上是将训练样本总结为模型,因此在每个类别中有足够数量的训练样本时表现最佳。此外,当前的实现基于SAX,调整SAX的参数(如字母表大小)可能需要用户深入研究数据样本以获得最佳性能。
超级会员免费看
订阅专栏 解锁全文
414

被折叠的 条评论
为什么被折叠?



