多视图学习
数据的采集越来越呈现出多源异构特性,在越来越多的实际问题中存在着大量对应着多组数据源的样本,即多视图数据。
主要算法
1)多视图学习与多核学习之间具有天然的联系,这是因为不同的核函数自然地对应着不同的视图,多核学习为多视图学习提供了一种融合不同视图数据和不同结构数据的有效方式。
2)协同训练。其来源于半监督学习问题,算法首先利用有标号样本在两个视图上分别训练一个朴素贝叶斯分类器,然后每个分类器从无标号样本中选出若干预测置信度较高的样本进行标记,并将其加入到另一个视图的有标号样本数据集中,随后用扩充后的有标号数据集在每个视图上重新训练分类器,直至达到某一终止条件。
无监督情况下的协同训练算法,提出了k-means、k-medoids等经典聚类算法的多视图学习模型
3)子空间学习(Subspace Learning):子空间学习假设所有视图都由一个潜在的子空间产生,进而直接利用所有的视图,以期获得这样的子空间。典型相关分析