无监督学习之K-Means

本文详细介绍了K-Means聚类算法的工作原理,包括簇分类和聚类中心移动的过程,探讨了优化目标和随机初始化策略,以及如何选择合适的K值,并提供了避开局部最优解的方法。

1.K-Means要完成的事情

1.1簇分类

遍历所有数据,判断其与聚类中心点的距离,将与划分到与其最近的点的一类

1.2移动聚类中心

将K个聚类中心点移动到其所在点的均值处

若出现某一个聚类中心点没有点,要么重新初始化所有的据类中心点,要么删除该点,根据实际情况选择

2.优化目标

3.如何随机初始化?如何避开局部最优?

保证K<m,然后从训练样本中随机挑选K个样本作为聚类中心点。(k在2-10之间时,多次随机初始化可以得到局部最优,大于10后,多次随机初始化的效果不太好)

4.如何选择K的值?

观察可视化的图、聚类算法的输出等,但是K的值并不唯一

肘部法则:从k=1开始依次递增,画出k与代价函数J的折线图,找到曲线类似肘子的位置即为合理的分类数量,理想情况下如左图,但实际会出现右图的情况,这时这个方法就不适用了。最好的方法就是根据实际需要来确定。

 

 

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值