时序分类问题研究
1.时间序列分类问题是数据挖掘、机器学习中关于现实时间序列数据分析处理的一个重要研究方向。时间序列分类有着非常广泛的应用场景,不仅仅是在数据挖掘、机器学习领域受到关注,在统计学、信号处理、环境科学、计算生物学、图像处理、化学计量学等学科和领域中也有一定的影响
2.研究方法
(1)这类模型的重点在于如何度量不同时间序列样本之间的距离。1994年提出了至今广泛使用的动态时间规整算法(Dynamic Time Wraping,DTW)。基于实值序列的可编辑距离算法(EDR)、固定基数规整距离算法、最长公共子序列算法(LCSS)、FastDTW。
(2)这类方法则侧重于提取时序中的特有模式,比如子序列模式、频域信号特征等,包括基于离散傅立叶特征、小波变换、基于 Shapelet 特征模式方法、基于特征袋、以及基于核稀疏表示特征表示的方法等。
(3)基于模型的方法,这类方法是近几年随着集成学习、深度学习兴起的强化模型,强调通过模型的集成、深度化等方式来获得较复杂的模型表示,使之能够处理时序分类问题。
3.这些已有的时序分类方法则会不同程度的失效,因为它们大多都还是基于训练集类别平衡的假设前提。