Kmeans算法原理

1、算法流程
KMeans算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。
Kmeans中,初始聚类中心的选取对聚类的结果有较大的影响,因此,在该算法中第一步是是随机的选取任意k个对象作为初始聚类中心,初始的代表一个簇。在每次迭代中,对数据集中剩余的每个对象,根据其与各个簇中心的距离赋给最近的簇。当考察完所有的数据对象后,一次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,j的值没有发生变化,则说明算法已经收敛。
算法过程如下:
(1)从N个数据中随机的选取K个数据作为质心。
(2)计算剩余的数据到每个质心的距离,并把它归到最近的质心所属的类。
(3)重新计算 各个类的质心。
(4)迭代(2)—>(3)直至新的质心与原质心相等或小于指定的阈值,算法结束。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值