机器学习实战学习笔记 ---- K-Means(K-均值)聚类算法

本文介绍了K-Means聚类算法,这是一种无监督学习方法,用于将相似对象归类到簇中。K-Means通过计算对象与质心(簇中点的均值)的距离来分配数据点,并不断迭代更新质心。算法的优点是简单实现,但存在可能陷入局部最优和对大规模数据集收敛速度慢的问题。适用于数值型数据的聚类场景,如地图上的点聚类。工作流程包括初始化质心,分配数据点并更新质心,直到簇分配不再变化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

聚类是一种无监督的学习,它将相似的对象归到一个簇中,将不相似的对象归到不同的簇中。

相似这一概念取决于所选择的相似度计算方式。

K-Means是发现给定数据集的K个簇的聚类算法,之所以称之为 “K-均” 值是因为它可以发现K个不同的簇,且每个簇的中心采用的所含值的均值计算而成。

簇个数K是用户指定的,每一个簇通过其质心(centroid),即簇中所有点的中心来描述。

聚类与分类算法的最大区别在于,分类的目标类别已知,而聚类的目标类别是未知的,

 

优缺点:

优点:容易实现

缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢

使用数据类型:数值型数据

 

K-Means场景

主要用来聚类,但是类别是未知的。

例如:对地图上的点进行聚类。

 

K-Means术语

  • 簇:所有数据点的集合,簇中的对象是相似的。

  • 质心:簇中所有点的中心(计算所有点的均值而来)。

  • SSE:Sum of Sqared Error (平房误差和),SSE值越小,表示越接近他们的质心,由于对误差取了平方,因此更加注重那么远离中心的点。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

杨鑫newlfe

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值