根据之前博文中k-均值算法表述,编写代码,对k-均值算法有个清晰认识
问题:将图中数据分成3组。
下图是整个k-均值算法的流程
1,首先选择 K 个随机的点,称为聚类中心(cluster centroids);
2,对于数据集中的每一个数据,按照距离 K 个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类。
3,计算每一个组的平均值,将该组所关联的中心点移动到平均值的位置。
代码:对于数据集中的每一个数据,按照距离 K 个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类。
代码:计算每一个组的平均值,将该组所关联的中心点移动到平均值的位置。
第一次计算
第六次计算
第十次计算
本文通过实战案例介绍K-均值算法的基本原理与步骤。包括如何选择初始聚类中心,依据距离分配数据点到最近的中心点形成聚类,并通过迭代计算各聚类的平均值来更新中心点位置。
1万+

被折叠的 条评论
为什么被折叠?



