基于三元决策的重叠聚类方法
在数据挖掘等众多领域中,聚类是揭示潜在模式的强大工具。传统的聚类方法大多假定每个对象只能被分配到一个确切的簇中,但在网络结构分析、无线传感器网络和生物信息等重要应用场景里,重叠聚类往往更为合适。本文将介绍一种基于决策理论粗糙集模型的三元决策重叠聚类策略,并提出相应的基于密度的聚类算法。
聚类相关理论基础
- 决策理论粗糙集模型(DTRS) :该模型运用贝叶斯决策程序来构建概率近似。设状态集合 $\Omega = {A, A^c}$ 分别表示对象在 $A$ 中和不在 $A$ 中。行动集合 $Action = {a_P, a_N, a_B}$ 分别代表将对象分类到正区域 $POS(A)$、负区域 $NEG(A)$ 和边界区域 $BND(A)$ 的三种行动。对于具有描述 $[x]$ 的对象,采取行动 $a_i$ 时的期望损失 $R(a_i|[x])$ 可表示为:
- $R(a_P|[x]) = \lambda_{PP}P(A|[x]) + \lambda_{PN}P(A^c|[x])$
- $R(a_N|[x]) = \lambda_{NP}P(A|[x]) + \lambda_{NN}P(A^c|[x])$
- $R(a_B|[x]) = \lambda_{BP}P(A|[x]) + \lambda_{BN}P(A^c|[x])$
其中,$P(A|[x])$ 和 $P(A^c|[x])$ 分别是等价类 $[x]$ 中的对象属于 $A$ 和 $A^c$ 的概率。
- 为聚类扩展 D