K-means

付施施.

于 2024-01-03 17:47:51 发布

阅读量1.1k

点赞数 20

CC 4.0 BY-SA版权

分类专栏：学习笔记文章标签： kmeans 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/a1658599638/article/details/135369561

学习同时被 2 个专栏收录

21 篇文章

订阅专栏

15 篇文章

订阅专栏

本文详细介绍了K-means聚类算法，通过欧几里得距离将数据点分配到最近的聚类中心，包括随机初始化聚类中心、计算距离、更新聚类中心以及算法收敛条件。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

先来看一下一个K-means的聚类效果图

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

在 K-Means 算法中，距离最近通常是指欧几里得距离（Euclidean distance）。欧几里得距离是指两个数据点在特征空间内的直线距离。公式如下所示：

$distance(xi,cj)=∑k=1d(xik−cjk)2distance(x_i, c_j) = \sqrt{\sum_{k=1}^d (x_{ik} - c_{jk})^2}$

其中， $x_i$ 是数据集中的第 i 个数据点， $c_j$ 是聚类中心点， $d$ 是特征空间的维度数。通过计算数据点与各个聚类中心点之间的欧几里得距离，可以确定每个数据点所属的簇。

具体而言，在下面算法的第二步中，对于每个数据点 $x_i$ ，计算它与 K 个聚类中心点之间的距离（即 $distance(x_i, c_j)$ ），然后将其分配给距离最近的聚类中心点 $c_j$ 所代表的聚类。

简单来说，就是找到每个数据点与各个聚类中心点之间的欧几里得距离，然后将其归类到距离最近的聚类中心点所代表的聚类中去。

K-means聚类步骤

1、随机设置K个特征空间内的点作为初始的聚类中心（一开始就要设置）
2、对于其他的每个数据点，计算其到 K 个聚类中心的距离，并将其归类到距离最近的聚类中心所属的聚类。
3、对于每个聚类，重新计算其新的聚类中心，通常是使用该聚类所有数据点的平均值作为新的聚类中心。
4、如果新的聚类中心点与原来的聚类中心点相同，则结束算法；否则重复步骤 2 和 3，直到收敛为止。

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。