- 概念
聚类分析 (cluster analysis)是一组将研究对象分为相同质的群组(clusters)的统计分析技术。 聚类分析也叫(classificationanalysis)或数值分类 (numerical taxonomy)。聚类与分类的不同在于, 聚类所要求划分的类是未知的。
- 聚类度量方法
聚类之间的度量是分距离和相似系数来度量的
距离:用来度量样品之间的相似性(KMeans聚类,系统中的Q型聚类)
相似系数:用来度量变量之间的相似性(系统聚类的R型聚类)
- 聚类分析研究方法
层次的方法( hierarchical method)
划分方法( partitioning method)
基于密度的方法(

本文介绍了聚类分析的基本概念、度量方法和常见研究方法,重点讲解了K-Means算法的工作原理、流程及优缺点。K-Means算法适用于大样本,能有效找到密集且区分开的聚类,但在确定K值和初始聚类中心选择上存在挑战。此外,还提及了Python实现的可能性。
最低0.47元/天 解锁文章
2792

被折叠的 条评论
为什么被折叠?



