基于图的多视图聚类方法用于连续模式挖掘
在数据挖掘和机器学习领域,多视图聚类是一个重要的研究方向,它可以处理来自多个不同视角的数据,挖掘出更全面、更有价值的模式。本文将介绍一种基于图的多视图聚类方法,用于连续模式挖掘,包括算法的复杂步骤、计算复杂度分析,以及实验设置和数据准备等内容。
1. 多视图数据集成
多视图数据集成是该算法的重要步骤之一。对于每个数据块 $t$($t = 1, 2, …$),集成矩阵 $M_t$ 是通过使用已批准视图的聚类解决方案的中心点(medoids)来构建的,这些中心点来自于 MST - MVS 算法第 3 阶段构建的集合 $C’_t$。
- 中心点的作用 :中心点被视为一个聚类的代表,每个聚类解决方案由其中心点进行总结。这种方法具有通信效率高和隐私保护的优点,因为在构建全局模型 $CM_t$ 时,不需要传输每个视图的完整数据,只需要传输每个聚类解决方案的中心点,从而保护了数据隐私。
- 集成矩阵的构建 :集成矩阵 $M_t$ 的每一列是 $C’_t$ 中一个聚类解决方案的中心点,每一行代表一个特征向量。如果一个中心点从一个视图中提取,那么该中心点在其他视图中对应的数据点也会被用于构建多视图数据点,即填充 $M_t$ 中的相应列。
例如,如果图 3 中的 $C1$ 是从视图 1 中提取的中心点,那么该列的其余部分(视图 2 和视图 3)将包含该数据点从其他两个视图中提取的剩余特征。如果某个视图没有通过第 2 阶段的评估标准,则该视图不会提供任何中心点。
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



