K-均值聚类算法

本文介绍了K-均值聚类算法的基本原理和执行流程,包括随机选择初始质心,通过计算欧氏距离分配数据点,以及如何更新质心直到收敛。详细阐述了如何计算欧氏距离,并提供了算法的执行示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

系列阅读

随机确定k个初始点作为质心,然后将数据集中的每个点分配到一个簇中,完成之后,每个簇的质心更新为该簇所有点的平均值

随机初始点算法流程

dataSet:
[[ 1.658985  4.285136]
 ....
 [-4.905566 -2.91107 ]]

k:2  质心数

n:2 列数

centroids: 存放随机初始点
[[0. 0.]
 [0. 0.]]


 循环n次
   依次取每列的最小值
   j=0 :  minJ:[[-5.379713]]
   得到本列最小值最大值之间的差值
   10.217851

   np.random.rand(k,1) 随机生成k个0-1之间的值
   centroids[:,j] 利用随机数和差值得到第j列
   [[3.07023768 0.        ]
   [1.3933703  0.        ]]

   循环完毕得到速记点centroids
   

向量欧氏距离计算
第一个点 vecA:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值