学习《机器学习100天》第31天 K-均值聚类

探讨了无监督学习中的K-均值聚类算法,包括其工作原理、目标及如何通过迭代过程优化簇内方差,达到数据点最优划分。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

github上的项目,跟着一起学习

项目地址    https://github.com/MLEveryday/100-Days-Of-ML-Code

    转到无监督学习,并研究了聚类。可在作者网站查询。发现一个奇妙的动画有助于理解K-均值聚类。

学习笔记

    动画是关于,怎么把一些没有标记的点,分为各个簇,并调整簇中心位置,使划分更好。

无监督学习

聚类算法:把族群或数据点分成一系列的组,使得相同簇中的数据点比其他的组更相似。

K-均值聚类:把所有项分成k个簇,相同簇中的所有项彼此尽量相似,不同簇的项尽量不同。

距离测量(类似欧式距离)用于计算数据点的相似度和相异度。每个簇有一个形心,最能代表簇的节点。

 

K-均值聚类如何工作

K-均值聚类的目标,使总体群内方差最小,或平方误差函数:

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值