需要源码请点赞关注收藏后评论区留言私信~~~
算法原理
层次聚类 (Hierarchical Clustering)就是按照某种方法进行层次分类,直到满足某种条件为止。层次聚类主要分成两类
凝聚:从下到上。首先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到所有的对象都在一个簇中,或者满足某个终结条件
分裂:从上到下。首先将所有对象置于同一个簇中,然后逐渐细分为越来越小的簇,直到每个对象自成一簇,或者达到了某个终止条件
簇间距离度量
1. 最短距离法(最大相似度)
最短距离被定义为两个类中最靠近的两个对象间的距离为簇间距离
2.最长距离法(最小相似度)
最长距离被定义为两个类中最远的像个对象间的距离为簇间距离
3. 类平均法
计算两类中任意两个对象间的距离的平均值作为簇间距离