基于最优传输的协作多视图聚类框架
1. 引言
无监督聚类方法近年来越来越受欢迎,因为它们能够对未标记的数据进行分组,这对于人类来说是非常困难的。近年来,许多新的聚类算法不断涌现,现有的方法也得到了改进。然而,由于难以提出一种适用于所有数据类型的通用方法,这些技术各有其特点。每个聚类方法都有其创建聚类的目标偏差,因此不同的方法对同一数据可能产生截然不同的聚类结果,而且同一算法的结果也会因初始化或参数设置而异。
为了解决这个问题,一些方法建议利用不同的聚类结果,以充分发挥其潜在的多样性。多视图聚类就是这样一种强大的方法,它的目标是通过结合多视图特征的信息,形成相似主题的一致聚类,而不是像传统聚类方法那样仅使用单一特征集。这种方法的重要性在于特征的多样性,它不仅能确保一致的聚类,还能提供更好的解释。
另一方面,协作学习最近成为多模型聚类框架中颇具吸引力的方法之一。其主要思想是在不同模型之间交换信息,以在尊重每个模型机密性的前提下,优化提高局部质量。
本文旨在通过协作学习在视图之间创建先验交互,从而改进共识聚类。所提出的方法基于最优传输理论,提出了两种主要的共识聚类算法,通过协作步骤从每个视图的数据分布中学习改进的数据结构,然后通过聚合步骤得到质量更好的统一模型。
2. 相关工作
将多个模型结合起来的想法凸显了分布式数据的范式,其主要目标是在确保数据高质量和更好可视化的同时,获得全局数据集的统一视图。信息的融合必须遵循许多属性,以提高质量并避免丢失从模型中学到的知识。以下是需要检查的重要条件:
- 鲁棒性 :组合模型的性能应优于单一聚类算法,具有更好的复杂度,避免过拟合。
超级会员免费看
订阅专栏 解锁全文
13

被折叠的 条评论
为什么被折叠?



