基于非负矩阵分解的多视图聚类及图基多视图聚类方法
一、基于非负矩阵分解的多视图聚类
- 数据集介绍
- Classic30 和 Classic300 :源自 Classic3,最初有 Medline、Cisi 和 Cranfield 三个类别。Classic30 是 30 篇随机选取的论文集合,每篇论文约 1000 字;Classic300 是 300 篇随机选取的文档集合,每篇文档约 3625 字。
- 20 - Newsgroup—NG5 :是 20 - Newsgroup 数据的子集,包含 500 篇论文,每篇论文描述约 2000 字,与政治领域相关。
- 波形数据集上的方法演示
- 数据分离 :将 5000×40 的基本波形数据集分为两个数据集,一个 5000×20 包含所有重要变量,另一个 5000×20 包含噪声变量子集。
- 聚类过程
- 利用 PCA 将数据投影到二维空间,颜色表示每个数据的关联簇。
- 使用 NMF 对仅包含相关特征的子集进行聚类,准确率为 74.3%。
- 采用协作原则在所有 NMF 聚类结果之间共享聚类知识,不访问源数据。
- 结果分析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



