前言
对几类聚类方法的流程简单总结。
- 各种聚类算法的系统介绍和比较
- 聚类方法:DBSCAN算法研究(1)–DBSCAN原理、流程、参数设置、优缺点以及算法
- DBScan的参数调节
- k-means的原理,优缺点以及改进
- DBSCAN聚类算法原理及其实现
1. 基于层级的聚类(如BIRCH)
-
自底向上开始聚类,最开始将所有的样本点视为一个类。
-
计算不同类之间的相似度
-single linkage:两个类中距离最短的两个点的距离。
-complete linkage:两个类距离最远的两个点的距离。
-average linkage: 两个类中样本点的平均距离。 -
合并两个距离最短的类。
-
重复2,3直到所有样本点合并为一个类,或者达到结束准则条件。
2. 基于划分的方法-Kmeans
思想:族内距离尽可能近,族间距离

本文总结了三种聚类方法:基于层级的聚类(如BIRCH)、基于划分的K-means以及基于密度的DBSCAN。K-means算法简单、收敛快,但对异常点敏感;DBSCAN则能处理密度不均匀的数据,但参数选择较为关键。层级聚类和K-means对噪声敏感,而DBSCAN可以识别异常点。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



