48、探索聚类集成技术性能极限与多特征相似性轮廓分组

探索聚类集成技术性能极限与多特征相似性轮廓分组

1. 聚类集成技术性能极限探索

在聚类集成技术中,我们关注如何衡量聚类结果的质量以及探索其性能极限。首先,定义了距离总和(SOD)的概念,对于一个聚类结果 $\tilde{P}$,其 SOD 为 $SOD(\tilde{P}) = \sum_{i=1}^{N} d(\tilde{P}, P_i)$,其中 $d$ 是距离函数,$P_i$ 是已知的分区。而最优分区 $P^ $ 的 SOD 为 $SOD(P^ ) = \sum_{i=1}^{N} d(P^ , P_i)$,并且有 $SOD(\tilde{P}) \geq SOD(P^ )$。

由于 $P^ $ 和 $SOD(P^ )$ 通常是未知的,我们采用一个下界 $\Gamma$ 来衡量 $\tilde{P}$ 的质量,即 $0 \leq \Gamma \leq SOD(P^*) \leq SOD(\tilde{P})$,用 $SOD(\tilde{P}) - \Gamma$ 来评估 $\tilde{P}$ 的质量。这个下界 $\Gamma$ 可以通过线性规划来计算,具体如下:
最小化 $x_1 + x_2 + \cdots + x_N$,约束条件为:
- 对于任意 $i, j \in {1, 2, \cdots, N}$,$i \neq j$,有
- $x_i + x_j \geq d(P_i, P_j)$
- $x_i + d(P_i, P_j) \geq x_j$
- $x_j + d(P_i, P_j) \geq x_i$
- 对于任意 $i \in {1, 2, \cd

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值