多共识聚类:迭代合并/分裂方法详解
在数据聚类领域,寻找一种能够有效整合多个聚类结果,生成高质量共识聚类的方法至关重要。本文将介绍一种新的多共识聚类方法,它能够生成多个共识聚类解决方案,并为用户推荐与聚类集成最相似的解决方案。
1. 聚类模式
在聚类分析中,我们可以通过聚类成员矩阵 M 来表示每个实例所属的聚类。矩阵 M 的行呈现二进制模式(频繁项集),这些模式告诉我们每个实例所属的聚类。利用频繁闭项集(FCI)方法,我们可以找到所有共享相同聚类模式的实例集。FCI 不仅可以从完整的基础聚类集合中发现模式,还可以从其子集中发现模式,只要它们满足 FCI 的属性。
我们将实例标识符集合与其对应的聚类标识符集合的组合称为频繁闭模式(FCP)。以下是从某个矩阵中提取的 FCP 示例:
| FCP ID | 项集 (FCIs) | 实例 ID 集 |
| — | — | — |
| 1 | {P 1 1 , P 2 1 , P 3 1 , P 4 2 , P 5 1 } | {3} |
| 2 | {P 1 1 , P 2 2 , P 3 1 , P 4 2 , P 5 1 } | {4} |
| 3 | {P 1 2 , P 2 2 , P 3 1 , P 4 2 , P 5 1 } | {5} |
|… |… |… |
频繁闭模式 P = (C, I) 在聚类成员矩阵 M = (I, C, R) 中需满足以下条件:
- 对于所有 i ∈ I 和所有 c ∈ C,都有 (i, c) ∈ R。
- |I| ≥ 最小支持度,即 C 是一个频繁项集。
- 不存在 i′ ∈ I,使得对
超级会员免费看
订阅专栏 解锁全文
593

被折叠的 条评论
为什么被折叠?



