前言
对几类聚类方法的流程简单总结。
- 各种聚类算法的系统介绍和比较
- 聚类方法:DBSCAN算法研究(1)–DBSCAN原理、流程、参数设置、优缺点以及算法
- DBScan的参数调节
- k-means的原理,优缺点以及改进
- DBSCAN聚类算法原理及其实现
1. 基于层级的聚类(如BIRCH)
-
自底向上开始聚类,最开始将所有的样本点视为一个类。
-
计算不同类之间的相似度
-single linkage:两个类中距离最短的两个点的距离。
-complete linkage:两个类距离最远的两个点的距离。
-average linkage: 两个类中样本点的平均距离。 -
合并两个距离最短的类。
-
重复2,3直到所有样本点合并为一个类,或者达到结束准则条件。