谱聚类基础

本文深入探讨了谱聚类算法的原理与应用,该算法源自图论,通过构造无向权重图并切图来实现数据聚类。文章详细介绍了谱聚类所需的基础知识,包括无向权重图、相似矩阵、拉普拉斯矩阵以及两种切图方式——RatioCut和Ncut,最后总结了谱聚类的算法流程。

谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。下面我们就对谱聚类的算法原理做一个总结。

1. 谱聚类概述

谱聚类是从图论中演化出来的算法,后来在聚类中得到了广泛的应用。它的主要思想是把所有的数据看做空间中的点,这些点之间可以用边连接起来。距离较远的两个点之间的边权重值较低,而距离较近的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。
  乍一看,这个算法原理的确简单,但是要完全理解这个算法的话,需要对图论中的无向图,线性代数和矩阵分析都有一定的了解。下面我们就从这些需要的基础知识开始,一步步学习谱聚类。

2. 谱聚类基础之一:无向权重图

在这里插入图片描述

3. 谱聚类基础之二:相似矩阵

在这里插入图片描述

4. 谱聚类基础之三:拉普拉斯矩阵

在这里插入图片描述

5. 谱聚类基础之四:无向图切图

在这里插入图片描述

6. 谱聚类之切图聚类

为了避免最小切图导致的切图效果不佳,我们需要对每个子图的规模做出限定,一般来说,有两种切图方式,第一种是RatioCut,第二种是Ncut。下面我们分别加以介绍。

6.1 RatioCut切图

在这里插入图片描述
在这里插入图片描述6.2 Ncut切图
在这里插入图片描述在这里插入图片描述

7. 谱聚类算法流程

在这里插入图片描述
理解为什么要取k个最小的特征值对应的特征向量很重要(第6.1节已讲)

8. 谱聚类算法总结

在这里插入图片描述转自:https://www.cnblogs.com/pinard/p/6221564.html

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值