K-means聚类算法

最新推荐文章于 2025-04-15 23:09:39 发布

somnus丶夜小贱

最新推荐文章于 2025-04-15 23:09:39 发布

阅读量1.5k

点赞数

本文链接：https://blog.youkuaiyun.com/qq_41721458/article/details/104823420

版权

K-means算法是一种无监督聚类算法，通过计算实例点到聚类中心的距离进行分簇。它包括随机选择初始聚类中心，计算实例点归属的簇，更新聚类中心等步骤，直到聚类中心不变或达到预设迭代次数。关键问题包括k值选择和初始聚类中心的选取。算法优点是实现简单、效果良好，但k值选择困难，且结果易受初始中心影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

k-means算法
　　一、算法概述
　　k-means中的k指的是数据聚成多少个簇，而means指的是根据簇的均值来确定簇中心，从而计算每个实例到每个簇的距离。
　　k-means聚类算法是一种无监督聚类算法，之前我们讲过KNN（K最近算法），是一种有监督的分类算法，其实本质上，KNN和K-means聚类算法，大同小异，与之不一样的地方在于，KNN是计算该实例到每个实例的距离，最后得出其自己的类别；而K-means聚类，是无监督的，是计算每个实例与聚类中心的距离，然后将该实例划分到与聚类中心近的那一类别，重复数次，直到聚类中心不再变化。
　　二、k-means算法原理
　　k-means的算法原理很简单，对于给定的数据集，假设我们想要把数据分成k类，即k个类簇，则有：
　　1）随机从数据集中选取k个点作为初始的聚类中心；（或者随机取k个点作为初始的聚类中心）
　　2）计算数据集中每个实例点到k个聚类中心的距离，然后将该实例点分到最近的聚类中，这样就得到了k个簇；
　　3）根据聚成的k个簇，重新计算每个簇的聚类中心；
　　4）重复上述2-3步，直到k个簇的聚类中心不再变化，或者迭代一定的次数之后，即可停止。
　　三、算法小例子
　　在这里插入图片描述
　　假设现在我们有数据集，如上图࿰

最低0.47元/天解锁文章