Boss
bag-of-SFA-symbols
它首先从时间序列中提取子结构(substructures)
对子结构应用低通滤波和量子化,这能够降低噪声,并使用字符串匹配算法
然后比较两个时间序列noise-reduced patterns的差别

优点:
快
应用了降噪(noise reduction)
invariance to offsets is treated as a parameter
结构基的相似性
和dtw一样快,并且比dtw更准确。
具体过程:
对时间序列 一固定长度的滑动窗口。
每个窗口通过减去均值和方差,进行z-normalized
从值到字符
进行 SFA (symbolic fourier approximation)
作用:
低通滤波 (low pass filtering)
字符表示(string representation) 使用量子化来表示 (quantisation)
-
分为两步
- 近似(approximation )使用 DFT discrete fourier transform来近似
- 量子化(quantisation) 使用MCB multiple coefficient binning
-
DFT
分解一个长度为n的信号T,成为一系列正交项基函数,每一个基能够被表示为
Xu=(realu,imagu)foru=0,1,...,n−1X_u=(real_u, imag_u) for u=0,1,...,n-1Xu=(realu,imagu)foru=0,1,...,n−1,成为傅里叶系数
DFT(T)=X0...Xn−1=(real0,imag0,...realn−1,imagn−1)DFT(T) = X_0...X_{n-1}=(real_0,imag_0,...real_{n-1},imag_{n-1})DF

该博客介绍了BOSS方法在序列挖掘中的应用,它通过提取时间序列的子结构,进行低通滤波和量子化降噪,然后利用字符串匹配算法比较两个序列的差异。BOSS方法速度快,能有效降噪,并具有对偏移不变性的参数调整能力。其主要步骤包括固定长度滑动窗口、Z归一化、SFA符号傅里叶近似和量子化。通过DFT进行低通滤波和MCB量子化,最终计算BOSS距离来衡量序列间的相似性。
最低0.47元/天 解锁文章
8777

被折叠的 条评论
为什么被折叠?



