【python】实现k-means

本文介绍了K-Means聚类算法的步骤,包括K值的选择(手肘法)、算法实现、优点和缺点。K值选取时,通过观察误差平方和(SSE)随k变化的趋势,选择肘部对应的k值。K-Means算法简单易懂,适用于大数据集且簇近似高斯分布的情况,但缺点是K值需要预设,对初始中心和异常值敏感。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

K-Means

(理论部分略)

步骤:

  1. 选择初始化的k个样本作为初始聚类 C = C 1 , . . . , C k C=C_1,...,C_k C=C1,...,Ck
  2. 针对数据集中每个样本 x i x_i xi,计算它到k个聚类中心的距离,并将其分到距离最小的聚类中心所对应的类别
  3. 针对每个类别 C j C_j Cj,重新计算它的聚类中心点 C j = 1 c i ∑ x ∈ c i x C_j=\frac{1}{c_i}\sum_{x \in {c_i}}x
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值