k-Shape: Efficient and Accurate Clustering of Time Series解读

k-Shape: Efficient and Accurate Clustering of Time Series

John Paparrizos Luis Gravano Columbia University
ACM SIGMOD 2015

主要贡献

  • 提出一种新的对尺度和漂移具有不变性的距离度量
  • 提出一种新的计算聚类中心的方法
  • 提出一种通用性强的时间序列聚类算法——k-shape算法
  • 通过实验验证算法为state-of-the-art

目前聚类算法存在的问题

  • 无法处理大的数据集,计算复杂度高
  • 通用性不好,一般只针对特定问题有效

时间序列比较的关键问题——处理各种distortions(扭曲?)

  • Scaling and transform invariances 量纲不同、映射不变性
  • Shift invariances 序列相似但是存在相位漂移
  • Uniform scaling invariance 序列的长度不一致(压缩、拉伸)
  • Occlusion invariance 序列存在缺失

本文主要解决前两个问题,第一个问题通过z-normalization可以解决。

基于互相关的度量SBD——解决相位漂移问题

固定序列y,移动序列x,找到最佳匹配

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值