一、多视图聚类
- 基于协同训练(Co-trainning)的多视图聚类算法 : 各个视图在进行聚类时,通过将自己最有用的信息提供给其它视图,通过这种信息交换,可以逐步修正和改进自己的聚类效果。
(例子:假设我们想对一组动物进行分类,有两个人在看这组动物。一个人通过动物的外形(如体型、毛发颜色等)来分类,而另一个人通过动物的叫声进行分类。起初,他们各自的分类可能不一致,但是他们可以互相交流意见。比如,如果一个人认为某个动物是狗,而另一个人听到它发出的声音也像狗,他们可以互相验证,从而达成一致的分类。这就是协同训练的思想。
-
基于多核学习(Multi-Kernel Learning )的多视图聚类算法: 通过融合多个核函数,将数据的特征从低维转换到高维,然后再进行聚类。(低维到高维)
-
基于子空间学习(Subspace learning)的多视图聚类算法:高维数据往往包含很多冗余信息,而实际有用的信息可能集中在某个“低维空间”(子空间)中。通过找出多视图数据中的共享低维空间,使得算法能更好地聚类和分析数据。 (高维到低维)
-
深度多视图聚类算法
二、不完全多视图聚类
不完全多视图聚类是数据样本缺失的情况下,然后再对数据进行一个聚类。
-
基于数据补全:其核心思想是利用已有的视图信息来推测和填补缺失的视图数据,然后对完整的数据进行聚类分析。
-
基于矩阵分解 : 常见的做法是借助一个指示矩阵指示当前样本是否具有完整表示,最后学习所有视图的
低维一致性表示(潜在表示)。
补充说明:指示矩阵是一个二值矩阵,它记录了每个样本在不同视图中的数据是否完整。比如,如果某个样本在某个视图中有完整数据,指示矩阵的对应位置就标记为1;如果某个视图的数据缺失,就标记为0。)通过矩阵分解,算法会将所有视图的数据投影到一个低维空间中,找到这些视图的一致性表示。 -
基于深度学习(Deep Learning)