时间序列分类中相似性度量的融合
1. 引言
时间序列分类是人工智能中以数据驱动决策任务的重要研究课题之一。它在众多领域都有广泛应用,比如医学领域中患者每小时的血压数据、书写时圆珠笔的位置坐标、声学或心电图信号等,任务是识别信号所属的预定义类别,这些类别可能对应着人的书写或言语内容,或者患者的健康状况。除了语音识别,时间序列分类还在金融、医学、生物识别、化学、天文学、机器人技术、网络和工业等领域发挥作用。
随着对时间序列分类的关注度不断提高,涌现出了各种方法,包括神经网络、贝叶斯网络、遗传算法、支持向量机和频繁模式挖掘等。近年来令人惊讶的是,使用动态时间规整(DTW)距离的简单 1 - 最近邻(1 - NN)分类器表现出色,甚至优于许多先进的时间序列分类方法。这表明在时间序列分类中,距离度量的选择至关重要。DTW 允许时间序列进行移位和拉伸,能很好地捕捉两个时间序列形状的全局相似性,但在特定应用中,其他特征属性也可能很关键,如频域中的全局或局部行为,可通过傅里叶或余弦谱、小波变换来捕捉。
本文将详细研究这一现象,考虑一组先进的时间序列相似性度量方法,探讨它们所捕捉的相似性类型。主要贡献是提出一个框架,用于以原则性的方式融合这些不同的相似性度量,并开发一种混合相似性度量。通过在 35 个公开的真实世界数据集上进行时间序列分类实验,证明该方法在分类准确性上有显著提升。
2. 相关工作
在融合相似性度量方面,有许多相关工作。以往有很多尝试通过组合多个分类器的输出来进行融合,形成分类器集成,如多数投票、加权投票,以及更复杂的装袋、提升和堆叠等方法,这些方法也被应用于时间序列分类。但本文的目标是融合相似性度量,而非在分类器输出层面进行操作。
超级会员免费看
订阅专栏 解锁全文
3376

被折叠的 条评论
为什么被折叠?



