机器学习实战--kmeans实例讲解

本文详细介绍了kMeans聚类算法,将其概括为选择初始质心、计算数据点到质心的距离、重新分配数据点及更新质心的过程。通过不断迭代直至质心稳定,实现属性相似的数据点归为一类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前面几篇讲了机器学习中的分类,今天讲一下聚类算法–kmeans,聚类通俗地说就是将一堆数据分成几堆,属性相似的在一起(物以类聚人以群分)。
kmeans的原理十分简单,直接上步骤:

  1. 我们假定将数据分成k堆,先从数据里面随机选k个点作为初始质心
  2. 依次计算剩下的数据距每个质心的距离,为每个点选取距离最小的质心
  3. 这就完成了一次聚类,但是效果肯定不是很好,我们针对每个堆再计算质心,得到k个新的质心
  4. 再对所有的数据计算距每个新的质心的距离,再为每个点选取新的距离最小的质心
  5. 不停的循环这个过程,直到质心不再改变为止
from numpy import *
def loadDataSet(filename):
    dataMat=[]
    fr=open(filename)
    for line in fr.readlines():
        curline=line.strip().split('\t')
        fltline=map(float,curline)
        dataMat.append(list(fltline))
    return dataMat
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值