Definition
spectral clustering techniques make use of thespectrum (eigenvalues) of thesimilarity matrix of the data to performdimensionality reduction before clustering in fewer dimensions. The goal of spectral clustering is to partition the dataset into disjoint subsets with high intra-cluster similarity and low inter-cluster similarity.
由此可见,谱聚类就是一个图分割问题。用无向图 描述
维空间的数据点集
,
,其中每条边
关联一个权值
,描述点
和
之间的相似度,则图的邻接矩阵可用相似度矩阵
且
表示。
Similarity graph&matrix
在维空间中,用一个相似度函数
描述两点之间的相似度,如用高斯核
计算相似度。相似度矩阵的构建过程就是描述数据点集
中各数据点局部邻域关系图的过程,常用的构建方法有:
1. K-Nearest Neighbor
若是
的KNN邻接点,则
和