KMeans聚类算法
算法简介
K-means算法是比较经典的聚类算法,算法的基本思想是选取K个点(随机)作为中心进行聚类,然后对聚类的结果计算该类的质心,通过迭代的方法不断更新质心,直到质心不变或稍微移动为止,则最后的聚类结果就是最后的聚类结果。下面首先介绍下K-means具体的算法步骤。
算法步骤
1)选取K个点作为初始质心;
2)对每个样本分别计算到K个质心的相似度或距离,将该样本划分到相似度最高或距离最短的质心所在类;
3)对该轮聚类结果,计算每一个类别的质心,新的质心作为下一轮的质心;
4)判断算法是否满足终止条件,满足终止条件结束,否则继续第2、3、4步。
算法实现
算法具体代码见:https://code.youkuaiyun.com/snippets/2075544.git
参考文章:http://blog.youkuaiyun.com/xiaojimanman/article/details/51086879