聚类 之 层次聚类 的直觉 (AGNES算法)

本文详细介绍了层次聚类算法AGNES的工作原理,包括簇间距离定义:最大距离、最小距离及平均距离。并阐述了自底向上聚类策略的实现过程,从初始化每个样本为独立簇开始,通过迭代合并最近的簇直至达到预定聚类数量。

 

这个层次聚类算法AGNES就很简单了, 看书就能看明白,估计没人搜索吧,哈哈。

 

最主要的是定义两个簇之间的距离:

1.可以是两个簇之间 的最大距离: 两个簇 的 两个样本之间的距离最远 时的距离

2.可以是两个簇之间 的最小距离:两个簇 的 两个样本之间的距离最短时的距离

3.可以是两个簇之间 的平均距离:两个簇所有样本间距离的均值

 

 

取层次聚类 - 自底向上聚类策略 的 算法描述:

 

1. 把所有的样本各自都当成一个 簇, 并定义一个距离矩阵,这个矩阵是每个样本的簇到其余簇之间的距离。

2. 搜索距离 矩阵,找到最小的 两个簇,把他们合并后,其簇名取较小的簇名(eg:C1 + C3 ->C1),

然后把所有簇的名字都往前移动一位,(因为C3没有啦,所以C4改名叫C3,C5改名叫C4,这样在算距离矩阵的时候方便),

由于簇合并了,所以距离矩阵需要修正, 重新计算新的簇到其他所有簇间的距离。(eg:C1到C2的距离,C1到C3的距离、、)

3.一步步迭代步骤2,知道达到我们规定的聚类个数时,聚类结束。

 

OK,

 

88~

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值