这几天看到的各种文章中,总会不约而同的出现一个词——谱(spectral)
一看是看到这个谱,反映出来的是光谱、频谱,这一下把我带到沟里了,怎么想都想不明白。折腾了很久了之后,终于发现,此谱乃数学中的谱。那到底这个神奇的谱是什么呢?
或许,对于不是学数学出生的同志们来说,第一个接触到谱的概念应该是在线性代数之中的一个角落。可能很多人学过之后就再也记不起来了。现在回忆一下,有一个矩阵A,求得其特征值后,特征值中的最大值是…,哈哈,可能有的同志已经回忆起来了,就是
谱半径。有了第一印象后,就暂且先把谱理解为矩阵最大的特征值的一个华丽外号吧。这个谱是矩阵的函数,有一个很好的性质就是它的值小于或者等于矩阵的范数。好了,现在肯定会想到,谱有什么用?和图形又有什么关系呢?下面我们就从谱聚类(spectral clustering)来看一看。
谱聚类可谓是近年来最火的聚类算法(没有之一),貌似完胜大家熟悉的K-means。在流形学习和深度学习中也一度出现它的身影。甚至有人更是硬把谱跟大数据扯上关系,说是大数据成就了谱聚类,但我觉得在没想清楚大数据本质之前就这么炒作还是有点儿过了(大家心中都一个佛,但谁又真的知道佛是什么样子),这个貌似上世纪90年代就有了。在我看来,谱聚类算得上是K-means的一种扩展,或者说K-means可以算是谱聚类的一种特殊情况。再通俗点儿说,K-means方法适用的空间是欧式空间,而谱聚类没有这个限制,就好像一个是在实数域一个是在复