k-means++与Cops and Robber游戏分析
1. k-means++算法分析
在一般情况下,k-means++算法仅以可忽略的概率产生o(log k)近似。这一结论的证明基于高维实例,由于构建的单纯形处于正交维度,这些实例的维度为Θ(k²)。
对于随机变量的期望计算,设X是参数为p的几何分布随机变量,q := 1 - p,M为非负整数。截断随机变量Y := min {X, M}的期望值为:
[
E[Y] = \sum_{i = 1}^{\infty} \min{i, M} \cdot p \cdot q^{i - 1} = \sum_{i = 1}^{\infty} i \cdot p \cdot q^{i - 1} - \sum_{i = M + 1}^{\infty} (i - M) \cdot p \cdot q^{i - 1} = E[X] - q^M \cdot \sum_{i = 1}^{\infty} i \cdot p \cdot q^{i - 1} = (1 - q^M) \cdot E[X] = \frac{1 - q^M}{p}
]
同时,在证明过程中涉及多个不等式:
- 不等式(4):由(\Delta^2 \geq \tilde{\Delta}^2 \geq r \cdot \exp(\frac{r}{2}))(因为r > 0)可得(\Delta^2 > r)。
- 不等式(5):由于(\tilde{\Delta} \leq \sqrt{r} \cdot \exp(\frac{r}{2}) \leq \sqrt{r} \cdot \exp(\frac{\log k}{3}) =
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



