基于度量聚类最小化半径之和的研究
1. 基本概念与引理
在度量聚类问题中,我们希望找到一种聚类方式,使得所有聚类的半径之和最小。为了实现这一目标,我们需要引入一些基本概念和引理。
首先,对于一个集合 (Q) 和一个划分 (B’),我们定义一些距离。对于每个 (q_j),(a_j) 表示到 (B’) 中最近点的距离,(b_j) 表示到 (B’) 中最远点的距离。根据三角形不等式,有 (b_j - a_j \leq 2r)。
我们定义了两个重要的事件:
- (\pi(i)) 解决 (B) :如果 (i) 是第一个使得 (B’) 中的某个点属于 (Q_i) 的索引,则称 (\pi(i)) 解决 (B)。
- (\pi(i)) 切割 (B) :如果 (\pi(i)) 解决 (B) 且 (B’) 中至少有一个点未被分配到 (Q_i),则称 (\pi(i)) 切割 (B)。
划分切割 (B) 的概率可以通过以下公式计算:
[
\sum_{i} Pr[\pi(i) \text{ 切割 } B] = \sum_{j} Pr[q_j \text{ 切割 } B]
]
其中,(q_j) 切割 (B) 的事件需要两个事件同时发生:
- (E_1):(\beta) 落在区间 ([a_j, b_j)) 内。
- (E_2):(q_j) 在排序 (\pi) 中出现在 (q_1, \ldots, q_{j - 1}) 之前。
利用独立性,我们可以得到:
[
Pr[q_j \text{ 切
超级会员免费看
订阅专栏 解锁全文
1694

被折叠的 条评论
为什么被折叠?



