数据隐私保护与私有云入侵检测规则研究
1. 基于全域泛化的隐私保护
在数据发布场景中,隐私保护至关重要。为了在增量数据发布时保护隐私,提出了基于全域泛化的方法。
1.1 精度指标定义
设数据集 $D_{t_i} = {d_1, d_2, \ldots, d_r}$ 由一组准标识符属性 $QI = {A_1, A_2, \ldots, A_c}$ 组成,$R_{t_i}$ 是 $D_{t_i}$ 泛化后的发布数据集,$DGH_{A_q}$ 是准标识符属性 $A_q \in QI$ 的域泛化层次结构(其中 $q = {1, 2, \ldots, c}$),$h_{A_q}$ 是 $DGH_{A_q}$ 的高度。基于泛化的 $R_{t_i}$ 数据质量 $Prec(R_{t_i})$ 定义为:
$Prec(R_{t_i}) = 1 - \frac{\sum_{q = 1}^{c}\sum_{t = 1}^{r}\frac{h_{A_q}}{|DGH_{A_q}|}}{|D_{t_i}| \times c}$,其中 $|D_{t_i}| = r$。
1.2 增量隐私保护算法
以下是增量隐私保护的算法流程:
1. 当 $i = 1$ 时 :
- 生成所有通过将 $LV_{QI}$ 上的距离向量从 $[0, 0]$ 向上滚动到 $DV_{root}$ 对 $D_{t_i}$ 进行泛化得到的数据集集合 $allDV$,即 $allDV \leftarrow {D_{t_i}’|D_{t_i}’$ 是通过上述方式对 $D_{t_i}$ 泛化得到的数据集 $}$。
- 从
超级会员免费看
订阅专栏 解锁全文
94

被折叠的 条评论
为什么被折叠?



