随机簇图模型的改进算法
1. 基本概念与引理
在处理随机簇图模型的聚类问题时,有几个重要的概念和引理。首先,存在不等式 $|\varPhi(x)| \leq A\ln$,其中 $A$ 是一个绝对常数,$\varPhi(x)$ 表示标准正态 $(0, 1)$ 累积分布函数。
还有如下引理:
- 引理 1 :设集合 $A$ 有 $n$ 个元素,集合 $B$ 是 $A$ 的子集且有 $k$ 个元素。设 $S’$ 是 $A$ 的随机子集,$S$ 是 $A - S’$ 中大小为 $s$ 的随机子集。那么对于任意 $a \geq 0$,有 $P\left[\left||B \cap S| - \frac{k}{n}s\right| \geq a\sqrt{\frac{3(k/n)s}{}}\right] \leq 6\sqrt{k}e^{-a^2}$。
在后续内容中,如果一个事件发生的概率是 $1 - n^{-\varOmega(1)}$,我们就说该事件以高概率(w.h.p.)发生。
2. 基本算法
设 $G = (V, E)$ 是一个簇图,记 $A_i = |V_i|$,$a_i = \frac{|V_i|}{n}$,$\varGamma = \max_i \left|\frac{|V_i|}{n} - \frac{1}{m}\right|$。如果集合 $S \subseteq V$ 满足 $S \subseteq V_i$(对于某个簇 $V_i$),则称 $S$ 为子簇。如果对于所有的 $i$,要么 $V_i \subseteq S$ 要么 $V_i \subseteq V - S$,则诱导子图
超级会员免费看
订阅专栏 解锁全文
650

被折叠的 条评论
为什么被折叠?



