数据挖掘 K-均值

一、算法原理

二、算法流程

1.随机选取K个中心点

idx=np.random.choice(X.shape0,K,replace=False)

2.设置最大迭代次数,用循环实现

3.对所有样本进行归类,归到其最近的中心 中心用一个K行的数组表示

4.计算新的中心点

返回K行每行的np.mean

5.判断是否所有中心点距离<阈值,若是则退出。若不是则将中心点数组更新为第4步算的

6.最后,在退出循环后代表已经找好了中心,此时拿到k个中心的标签,就是它们的类别。

三、numpy方法

np.random.choice

np.argmin

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值