图聚类

图聚类

基于图的聚类。注意这里的图指的不是图片,而是顶点+边构成的图

将样例用图表示,则通过对图中顶点的划分完成聚类。

图的表示

  • 顶点:样本点
  • 聚类:顶点的划分
  • 边:样本点的相似度

 G(V,E)表示无向图,V=\left \{ v_{1},v_{2},..,{v_{m}} \right \}为点的集合,E为边集,W为权重,W_{ij}表示节点v_{i} 、v_{j} 之间相似度

图的划分

图的划分是将图完全划分成若干个子图,个子图无交集。

 

划分要求

  • 同子图内的点相似度高
  • 不同子图间的点相似度低

损失函数

由划分要求,我们给出损失函数为 ,所以我们的目标就是最小化这个损失函数。

图的划分两种常用方法

  • 谱聚类:连续优化方法。通过分析特征向量与特征值,获得聚类结果。
  • 最小割:离散优化方法。将最小割转化为最大网络求解。

这里着重讲解一下谱聚类算法。

谱聚类

是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行分析来完成聚类。

算法流程

  1. 计算拉普拉斯矩阵 L 。L=D-W , 其中W为权重矩阵,W为对称矩阵,且主对角线元素都为0;D为度矩阵,Dij,当i!=j时为0,否则Dii为以i为一顶点的所有边权重之和;L为半正定矩阵(即所有特征值非负值),最小特征值为0,且对应的特征向量为单位向量[1,1,...,1]^{T}
  2. 计算L的特征值与特征向量Ve=\left \{ v_{e1},v_{e2},...,v_{en} \right \}   
  3. 取出最小的前k个特征值对应的特征向量构成一个矩阵
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值