随机数据分区:编码、访问、隐私与多分区策略
1. 分区长度期望分析
在随机数据分区中,对于输入长度为 $n$ 位的序列 $B$,会将其划分为左分区 $LB$ 和右分区 $RB$。通过期望的线性性质,可得到左分区长度的期望 $E(|LB|)$ 的相关推导:
- 首先,$E(|LB|) = E(\sum_{i = 1}^{2d} f_i \cdot X_i) = \sum_{i = 1}^{2d} f_i \cdot E(X_i)$。
- 接着,根据引理 2 代入 $E(X_i)$ 的值,可得 $\sum_{i = 1}^{2d} f_i \cdot E(X_i) \leq \sum_{i = 1}^{2d} f_i \cdot (2q - \frac{q}{2^{d - 1}})$。
- 由于定义 $\sum_{i = 1}^{2d} f_i = \frac{n}{d}$,所以 $\sum_{i = 1}^{2d} f_i \cdot (2q - \frac{q}{2^{d - 1}}) \leq (2q - \frac{q}{2^{d - 1}}) \cdot \frac{n}{d}$。
- 进一步化简得到 $E(|LB|) \leq n \cdot (\frac{2q}{d} - \frac{q}{d \cdot 2^{d - 1}})$。
- 又因为 $|LB| + |RB| = n$,所以 $E(|RB|) = n - E(|LB|) > n \cdot (1 - \frac{2q}{d} + \frac{q}{d \cdot 2^{d - 1}})$。
当 $d$ 值较大时,$\frac{q}{d \cdot 2^{d - 1}}$ 项
超级会员免费看
订阅专栏 解锁全文
1057

被折叠的 条评论
为什么被折叠?



