K中心聚类法

本文介绍了K中心聚类法,它在处理噪音和离群值时比K-means更健壮。通过R语言的pam()函数展示了PAM算法的实现,该算法基于离差平方和计算成本。同时,K中心法的缺点是其执行效率相对较低。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

算法步骤:
1 随机选择k个点作为“中心点”
2 计算剩余的点到这k个中心点的距离,每个点被分配到最近的中心点组成聚簇
3 随机选择一个非中心点Or,用它代替某个现有的中心点Oj,计算这个代换的总代价S
4 如果S<0,则用Or代替Oj,形成新的k个中心点集合

5 重复2,直至中心点集合不发生变化


R语言的pam()实现算法:

PAM使用离差平方和(离差平方和(Sumof Squares of Deviations)是各项与平均项之差的平方的总和)来计算成本S(类似于ward距离的计算)
R语言的cluster包实现了PAM
K中心法的优点:对于“噪音较大和存在离群值的情况,K中心法更加健壮,不像Kmeans那样容易受到极端数据影响
K中心法的缺点:执行代价更高

> library(cluster)
>x <- iris[, 1:4]
> kc <- pa
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值