聚类分析
聚类是把数据按照相似性归纳成若干类别,同一类中的数据彼此相似,不同类中的数据相异。聚类分析可以建立抽象概念,发现数据的分布模式,探索可能的数据属性之间的相互关系。
1.K均值聚类
基本思路是把数据分配给最近中心的类中。
2.层次聚类
基本思想是按照某种方法进行层次分解。有自底向上的凝聚和自顶向下分裂两种方法。
3.密度聚类
基本思想是过滤低密度区域,发现稠密点的聚类。
4.网格聚类
基本思想是在量化后的网格空间结构中进行聚类。
总结一下各种聚类的几何特征:K均值聚类是线性的,层次聚类是凸面的,密度聚类可以是凹面的,网格聚类是网格的。