K-Means(K均值) 算法

最新推荐文章于 2025-02-22 12:02:09 发布

Ricky_Fung

最新推荐文章于 2025-02-22 12:02:09 发布

阅读量4.6k

点赞数

分类专栏：机器学习文章标签： K-Means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/top_code/article/details/41866599

版权

机器学习专栏收录该内容

3 篇文章

订阅专栏

K-Means算法的基本思想是初始随机给定K个簇中心，按照最邻近原则把待分类样本点分到各个簇。然后按平均法重新计算各个簇的质心，从而确定新的簇心。一直迭代，直到簇心的移动距离小于某个给定的值。K是我们事先需要给定的聚类数目(K小于样本的个数N)。

K-Means聚类算法主要分为三个步骤：

(1)随机在样本中选取K个样本点作为聚类中心。
(2)计算每个点到聚类中心的距离，将每个点聚类到离该点最近的聚类中心的簇中去。
(3)重新计算每个聚类中所有点的坐标平均值，并将这个平均值作为新的聚类中心
反复执行(2)、(3)，直到聚类中心点不再变化或变化很小为止。

下图展示了对n个样本点进行K-Means聚类的效果，这里K=2：

K-Means算法的优点：

是解决聚类问题的一种经典算法，简单、快速
对处理大数据集，该算法保持可伸缩性和高效率
当结果簇是密集的，它的效果较好

K-Means算法的缺点：

K值需要事先给定，而这个 K 值的选定是非常难以估计的。很多时候，事先并不知道给定的数据集应该分成多少个类别才最合适。
K-Means算法对初值敏感，对于不同的初始值，可能会得到不同的结果。(K-Means++算法可以用来解决这个问题，其可以有效地选择初始点)。
不适合于发现非凸面形状的簇或者大小差别很大的簇。
对躁声和孤立点数据敏感。

故K-Means算法常常用于其他聚类算法的一个阶段，如谱聚类。

博客等级

码龄12年

485
原创

759
点赞

1630
收藏

1084
粉丝

关注

私信

热门文章

分类专栏

最新评论

Thrift 入门指南
xiaofengclouder: 看似很乱担心讲的不清不楚，但实际上这个案例还是有点东西的，想入门的可以静下心来看完
httpclient Circular redirect to 'http://xxx.com'
名字忘了取了: 还没解决吗, 我也是这个问题
Android ListView addScrapView ArrayIndexOutOfBoundsException
xiaoweiguoyuan: 非常感谢，解决了我的问题
Java Proguard 代码混淆
ccmj: 为什么我没有proguard_common.cfg这个文件呢
Java 判断一个日期是否为今天、昨天
快给毕老师唱一个: 为什么要关注时分秒呢，年月日都一样就好了啊。计算一个after和before 消耗相较于比三个int值，消耗大太多倍了[code=java] final val dayOfYear = dateTime.getDayOfYear(); final val monthValue = dateTime.getMonthValue(); final val year = dateTime.getYear(); final val now = LocalDateTime.now(); return now.getDayOfYear() == dayOfYear&& now.getMonthValue()==monthValue&& now.getYear()==year; [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。