K-means聚类算法

K-means算法是一种无监督聚类算法,通过计算实例点到聚类中心的距离进行分簇。它包括随机选择初始聚类中心,计算实例点归属的簇,更新聚类中心等步骤,直到聚类中心不变或达到预设迭代次数。关键问题包括k值选择和初始聚类中心的选取。算法优点是实现简单、效果良好,但k值选择困难,且结果易受初始中心影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

k-means算法
  一、算法概述
  k-means中的k指的是数据聚成多少个簇,而means指的是根据簇的均值来确定簇中心,从而计算每个实例到每个簇的距离。
  k-means聚类算法是一种无监督聚类算法,之前我们讲过KNN(K最近算法),是一种有监督的分类算法,其实本质上,KNN和K-means聚类算法,大同小异,与之不一样的地方在于,KNN是计算该实例到每个实例的距离,最后得出其自己的类别;而K-means聚类,是无监督的,是计算每个实例与聚类中心的距离,然后将该实例划分到与聚类中心近的那一类别,重复数次,直到聚类中心不再变化。
  二、k-means算法原理
  k-means的算法原理很简单,对于给定的数据集,假设我们想要把数据分成k类,即k个类簇,则有:
  1)随机从数据集中选取k个点作为初始的聚类中心;(或者随机取k个点作为初始的聚类中心)
  2)计算数据集中每个实例点到k个聚类中心的距离,然后将该实例点分到最近的聚类中,这样就得到了k个簇;
  3)根据聚成的k个簇,重新计算每个簇的聚类中心;
  4)重复上述2-3步,直到k个簇的聚类中心不再变化,或者迭代一定的次数之后,即可停止。
  三、算法小例子
  在这里插入图片描述
  假设现在我们有数据集,如上图࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值