K-means聚类算法

本文介绍了K-means聚类算法的基本原理,包括随机选择初始中心、数据分配、更新中心和收敛过程。通过鸢尾花数据集的实例展示了算法的应用,强调了初始中心选择的重要性及如何确定最佳簇数。最后,提到了在实际使用中的注意事项,如数据预处理和防止初始化依赖问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

聚类,是指有一堆数据,不知道他们应该怎么分类,用算法将他们聚到一起进行分类。

K-means聚类算法是聚类算法中最基础的一个算法,虽然基础,但由于其出色的性能和相对较好的效果,至今依然是主流的聚类算法之一。

K-means原理

首先,我们有一堆数据,如下图:
![](https://img-blog.csdnimg.cn/direct/cb2e18f0b2bf496da3ac08732d03a806.pn
我们能看出来数据大概能分成如下三组,在聚类中称为“簇”
在这里插入图片描述
具体如何分呢?
Step1:随机选择K个数据点作为初始聚类中心,比如我们想把这个数据分成3类,就先随机找三个点作为中心
在这里插入图片描述
Step2:然后将每个数据点分配给最近的聚类中心,从而形成3个簇,就是上图中的绿色、紫色、黄色三个簇
Step3:基于当前的簇,重新计算每个簇的中心。这通常通过计算每个簇内所有点的均值来完成。再将我们的中心移动到计算出来的簇的中心,如下图

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值