八、聚类

聚类是一种无监督学习算法。
在这里插入图片描述
输入x为mn维,通过聚类聚为6簇,使得输出为m6维。有种降维的感觉。
在这里插入图片描述
1.相似度
因为聚类是通过样本间的联系来分成多个簇,所以要进行相似度的度量。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2、kmeans
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
改进
方法一:
计算一下四个簇的均值,MSE;如图,其中两个簇的MSE会比较小,均值会比较接近,说明这两个簇距离比较近,应该分为一个簇。同样地,第一个簇MSE比较大,应该分为两个簇。因此在最左边的簇中重新随机选取两个点进行计算,右边两个比较近的簇随机选取一个点进行计算。
即二分kmeans
在这里插入图片描述
方法二:
kmeans++
先选择一个中心点,计算所有点到该点的距离,然后将得到的距离进行归一化(概率),选择概率最大的点,可以理解为距离最远的点。

在这里插入图片描述
推导的时候可以理解为k簇方差相同的高斯分布,求最大似然。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
公式中H为熵。可以类比precision和recall

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
3.层次聚类方法
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
4、DBSCAN
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
5、密度最大值聚类
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
6、谱聚类
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
7、标签传递算法
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值