33、时间序列分类中相似性度量的融合

时间序列分类中相似性度量的融合

1. 引言

时间序列分类是人工智能中以数据驱动决策任务的重要研究课题之一。它在众多领域都有广泛应用,比如医学领域中患者每小时的血压数据、书写时圆珠笔的位置坐标、声学或心电图信号等,任务是识别信号所属的预定义类别,这些类别可能对应着人的书写或言语内容,或者患者的健康状况。除了语音识别,时间序列分类还在金融、医学、生物识别、化学、天文学、机器人技术、网络和工业等领域发挥作用。

随着对时间序列分类的关注度不断提高,涌现出了各种方法,包括神经网络、贝叶斯网络、遗传算法、支持向量机和频繁模式挖掘等。近年来令人惊讶的是,使用动态时间规整(DTW)距离的简单 1 - 最近邻(1 - NN)分类器表现出色,甚至优于许多先进的时间序列分类方法。这表明在时间序列分类中,距离度量的选择至关重要。DTW 允许时间序列进行移位和拉伸,能很好地捕捉两个时间序列形状的全局相似性,但在特定应用中,其他特征属性也可能很关键,如频域中的全局或局部行为,可通过傅里叶或余弦谱、小波变换来捕捉。

本文将详细研究这一现象,考虑一组先进的时间序列相似性度量方法,探讨它们所捕捉的相似性类型。主要贡献是提出一个框架,用于以原则性的方式融合这些不同的相似性度量,并开发一种混合相似性度量。通过在 35 个公开的真实世界数据集上进行时间序列分类实验,证明该方法在分类准确性上有显著提升。

2. 相关工作

在融合相似性度量方面,有许多相关工作。以往有很多尝试通过组合多个分类器的输出来进行融合,形成分类器集成,如多数投票、加权投票,以及更复杂的装袋、提升和堆叠等方法,这些方法也被应用于时间序列分类。但本文的目标是融合相似性度量,而非在分类器输出层面进行操作。

根据原作 https://pan.quark.cn/s/459657bcfd45 的源码改编 Classic-ML-Methods-Algo 引言 建立这个项目,是为了梳理和总结传统机器学习(Machine Learning)方法(methods)或者算法(algo),和各位同仁相互学习交流. 现在的深度学习本质上来自于传统的神经网络模型,很大程度上是传统机器学习的延续,同时也在不少时候需要结合传统方法来实现. 任何机器学习方法基本的流程结构都是通用的;使用的评价方法也基本通用;使用的一些数学知识也是通用的. 本文在梳理传统机器学习方法算法的同时也会顺便补充这些流程,数学上的知识以供参考. 机器学习 机器学习是人工智能(Artificial Intelligence)的一个分支,也是实现人工智能最重要的手段.区别于传统的基于规则(rule-based)的算法,机器学习可以从数据中获取知识,从而实现规定的任务[Ian Goodfellow and Yoshua Bengio and Aaron Courville的Deep Learning].这些知识可以分为四种: 总结(summarization) 预测(prediction) 估计(estimation) 假想验证(hypothesis testing) 机器学习主要关心的是预测[Varian在Big Data : New Tricks for Econometrics],预测的可以是连续性的输出变量,分类,聚类或者物品之间的有趣关联. 机器学习分类 根据数据配置(setting,是否有标签,可以是连续的也可以是离散的)和任务目标,我们可以将机器学习方法分为四种: 无监督(unsupervised) 训练数据没有给定...
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值