对聚类算法的进阶补充
聚类我们应该都知道它的用途,大体上的聚类我们的思路都是通过计算不同样本点的距离来进行分类。
入门算法:k-means算法



层次聚类:


密度聚类:









边界和噪声:
谱聚类:
拉普拉斯矩阵:
总结:
谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。
主要思想:
把所有的数据看做空间中的点,这些点之间可以用边连接起来。距离较远的两个点之间的边权重值较低,而距离较近的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。