这个层次聚类算法AGNES就很简单了, 看书就能看明白,估计没人搜索吧,哈哈。
最主要的是定义两个簇之间的距离:
1.可以是两个簇之间 的最大距离: 两个簇 的 两个样本之间的距离最远 时的距离
2.可以是两个簇之间 的最小距离:两个簇 的 两个样本之间的距离最短时的距离
3.可以是两个簇之间 的平均距离:两个簇所有样本间距离的均值
取层次聚类 - 自底向上聚类策略 的 算法描述:
1. 把所有的样本各自都当成一个 簇, 并定义一个距离矩阵,这个矩阵是每个样本的簇到其余簇之间的距离。
2. 搜索距离 矩阵,找到最小的 两个簇,把他们合并后,其簇名取较小的簇名(eg:C1 + C3 ->C1),
然后把所有簇的名字都往前移动一位,(因为C3没有啦,所以C4改名叫C3,C5改名叫C4,这样在算距离矩阵的时候方便),
由于簇合并了,所以距离矩阵需要修正, 重新计算新的簇到其他所有簇间的距离。(eg:C1到C2的距离,C1到C3的距离、、)
3.一步步迭代步骤2,知道达到我们规定的聚类个数时,聚类结束。
OK,
88~
本文详细介绍了层次聚类算法AGNES的工作原理,包括簇间距离定义:最大距离、最小距离及平均距离。并阐述了自底向上聚类策略的实现过程,从初始化每个样本为独立簇开始,通过迭代合并最近的簇直至达到预定聚类数量。
1678

被折叠的 条评论
为什么被折叠?



