一、算法原理
二、算法流程
1.随机选取K个中心点
idx=np.random.choice(X.shape0,K,replace=False)
2.设置最大迭代次数,用循环实现
3.对所有样本进行归类,归到其最近的中心 中心用一个K行的数组表示
4.计算新的中心点
返回K行每行的np.mean
5.判断是否所有中心点距离<阈值,若是则退出。若不是则将中心点数组更新为第4步算的
6.最后,在退出循环后代表已经找好了中心,此时拿到k个中心的标签,就是它们的类别。
三、numpy方法
np.random.choice
np.argmin