23、时间序列聚类算法：k-Shape、k-Means与HDBSCAN的比较

最新推荐文章于 2025-11-14 15:51:00 发布

code8

最新推荐文章于 2025-11-14 15:51:00 发布

阅读量79

点赞数

CC 4.0 BY-SA版权

分类专栏：解锁无监督学习的秘密文章标签： k-Shape k-Means HDBSCAN

本文链接：https://blog.youkuaiyun.com/code8/article/details/152289125

解锁无监督学习的秘密专栏收录该内容

24 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

时间序列聚类算法：k-Shape、k-Means与HDBSCAN的比较

在时间序列数据分析中，聚类是一项重要的任务，它可以帮助我们发现数据中的模式和结构。本文将介绍三种时间序列聚类算法：k-Shape、k-Means和HDBSCAN，并通过实验比较它们的性能。

1. k-Shape算法初步应用

首先，我们使用k-Shape算法进行时间序列聚类。设置最大迭代次数为100，训练轮数也为100。以下是具体的代码实现：

# Train using k-Shape
ks = KShape(n_clusters=2, max_iter=100, n_init=100,verbose=0)
ks.fit(X_train)

为了评估聚类的效果，我们使用调整后的兰德指数（adjusted Rand index）。该指数衡量了预测聚类和真实聚类之间的相似度，值接近0表示随机分配聚类，值接近1表示预测聚类与真实聚类完全匹配。我们使用Scikit-learn中的 adjusted_rand_score 函数来计算该指数。

# Make predictions and calculate adjusted Rand index
preds = ks.predict(X_train)
ars = adjusted_rand_score(data_train[:,0],preds)
print("Adjusted Rand Index:", ars)

运行结果显示

订阅专栏解锁全文

会员秒杀 ¥9.9 重磅福利

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

code8

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

k-Shape：高效准确的聚类方法

weixin_44028734的博客

03-06

1426

时间数据在许多学科中的扩散和无处不在，已经对时间序列的分析和挖掘产生了极大的兴趣。聚类是最流行的数据挖掘方法之一，不仅因为它的探索性，而且作为其他技术的预处理步骤或子程序。常用的有-means聚类算法。本文介绍了一种新的时间序列聚类算法k-Shape。k-Shape依赖于一个可扩展的迭代优化过程，它创建同质和良好分离的集群。作为距离度量，k-Shape使用标准化的交叉相关。基于距离度量的性质，我们开发了一种计算聚类质心的方法，在每次迭代中使用聚类质心来更新时间序列对聚类的分配。

k-shape时间序列聚类(tslearn)

fitzgerald0的博客

08-23

2万+

时间序列聚类概述 时间序列数据挖掘从技术角度来讲，一般有四种时间序列预测，时间序列分类，时间序列聚类，时间序列异常检测基本上包含了机器学习的几大领域由于时序数据的特殊性，所以每一个方面都与截面数据挖掘有所区别。本文主要讲讲时序聚类中的k-shape算法，和以往的风格一样，重在算法实现。时间序列数据的聚类，关键在于如何定义相似度。比如基于时间序列特征（len，max,min,std,lag）等可以使用 KMeans算法进行聚类。除了使用欧式距离以外，还可以使用dtw等方法，以及动态规划原理，对时间序列.

参与评论您还未登录，请先登录后发表或查看评论

时间序列聚类算法-《k-Shape: Efficient and Accurate Clustering of Time Series》解读

qq_28900249的博客

11-13

2万+

摘要本文提出了一个新颖的时间序列聚类算法k-shape，该算法的核心是迭代增强过程，可以生成同质且较好分离的聚类。该算法采用标准的互相关距离衡量方法，基于此距离衡量方法的特性，提出了一个计算簇心的方法，在每一次迭代中都用它来更新时间序列的聚类分配。作者通过大量和具有最好距离衡量方法的划分聚类，分层聚类，谱聚类比较的实验证明k-shape的鲁棒性。总之，k-shape是准确、高效的时间序列算法。...

利用kmeans或kshape聚类分析对归一化的无量纲时间-降雨序列进行聚类

全栈若城,专注知识分享

06-07

1669

利用kmeans或kshape聚类分析对归一化的无量纲时间-降雨序列进行聚类（分类，区分降雨雨型的差异）

时间序列聚类算法论文《k-Shape: Efficient and Accurate Clustering of Time Series》

Chauncy的博客

09-09

5526

ABSTRACT 聚类是最流行的数据挖掘方法之一。这不仅仅是因为聚类问题具有很强的探索性，还因为它可以作为其他技术的预处理步骤或子过程。本文提出一种的新的时间序列聚类算法——K-shape算法。该算法依赖于一个可度量的迭代优化过程，创建同构的、分割良好的群簇。K-shape聚类算法依赖使用了规范化之后的互相关系数作为距离的度量，在每次迭代中使用它来更新聚类对聚类时间序列的分配。 1. INTRODUCTION 聚类是应用非常广泛的一项技术，因为它不需要监督和数据标注。大多数时间序列分析技术，包

论文阅读_时序聚类K-Shape

谢彦的技术博客

12-26

4948

基本信息论文题目：k-Shape: Efficient and Accurate Clustering of Time Series 论文地址：https://dl.acm.org/doi/10.1145/2949741.2949758 相关源码：https://github.com/tslearn-team/tslearn/ 用法示例：https://tslearn.readthedocs.io/en/stable/auto_examples/clustering/plot_kshape.htm

时间序列聚类

qq_31807039的博客

04-27

7241

时间序列聚类：一种将时间序列数据分为不同组的无监督学习方法。聚类方法旨在找到数据中相似的子集，并将它们归为同一组。对于时间序列数据而言，聚类技术可以发现有相似特征的序列，并将它们划分为同一组，这有助于数据的分类和分析。时间序列聚类包括两种类型：子序列聚类和时间点聚类。子序列聚类是通过滑动窗口在一个时间序列中提取的一系列子序列上的聚类；时间点聚类基于时间点的时间接近度和对应值的相似性组合的聚类。时间序列聚类通常使用常见的聚类算法，如K-means、Ksahpe 、层次聚类等。

【告别k-means】k-Shape高效准确的聚类方法-完整Matlab代码

weixin_44028734的博客

03-07

924

k-shape

高维多元时序数据聚类

qq_25368751的博客

11-30

5639

收集数据的能力不断增强，使我们有可能收集大量的异构数据。在可用的异构数据中，时间序列代表着尚未被充分探索的信息母体。当前的数据挖掘技术在分析时间序列时存在多个缺点，尤其是在应同时分析多个时间序列（即多维时间序列）以从数据中提取知识时。

【时序聚类】论文解读k-Shape: Efficient and Accurate Clustering of Time Series

风雨潇潇一书生

03-04

7993

k-Shape: Efficient and Accurate Clustering of Time Series 【论文解读有不正确之处欢迎指正】论文来源：https://dl.acm.org/doi/10.1145/2949741.2949758 论文来自于2016年ACM SIGMOD（有说是2015年，没具体去查），论文下载：http://www.cs.columbia.edu...

Kshape 聚类-python实现

11-29

Kshape 聚类项目包含数据集里面包含一个数据集，以及py文件和jupyter文件另外，代码对应的有相关注释。

k-Shape: Efficient and Accurate Clustering of Time Series解读

SCS199411的博客

06-03

4414

k-Shape: Efficient and Accurate Clustering of Time Series John Paparrizos Luis Gravano Columbia University ACM SIGMOD 2015 主要贡献提出一种新的对尺度和漂移具有不变性的距离度量提出一种新的计算聚类中心的方法提出一种通用性强的时间序列聚类算法——k-shape算法 ...

Python用KShape对时间序列进行聚类和肘方法确定最优聚类数k可视化

拓端研究室TRL

08-05

941

全文链接：http://tecdat.cn/?p=27078时序数据的聚类方法该算法按照以下流程执行。使用基于互相关测量的距离标度（基于形状的距离：SBD）根据 1 计算时间序列聚类的质心。（一种新的基于质心的聚类算法，可保留时间序列的形状）划分成每个簇的方法和一般的kmeans一样，但是在计算距离尺度和重心的时候使用上面的1和2。相关视频importpandasaspd#读取数据帧，将...

tslearn使用轮廓系数（silhouette_score）评估KShape聚类效果

虚拟-Worder的博客

08-11

1万+

前言 tslearn和sklearn一样，是一款优秀的机器学习框架，tslearn更偏向于处理时间序列问题，如其聚类模块就包含了DTW（Dynamic Time Warping）等算法及变种，也提供了轮廓系数对聚类效果评估，十分方便。但可惜，tslearn似乎没有提供对KShape聚类的评估方法，而且tslearn用的人也不多，官方文档也是很 “简洁”，网上也搜不到多少相关文章，所以这里也就记录下自己的踩坑过程轮廓系数评估接口调用先看官方例子，这里X是一个三维的numpy数组，代表20段时间序

时间序列数据处理2——时间序列聚类算法