数据挖掘隐私保护与云计算负载均衡技术解析
1. 数据挖掘隐私保护:多维噪声添加模型(MNAM)
1.1 背景与问题提出
数据挖掘在带来便利的同时,也引发了严重的隐私问题。现有的隐私保护数据挖掘技术,尤其是针对多维数据集的技术,存在显著的数据丢失和信息泄露问题。为解决这些问题,提出了多维噪声添加模型(MNAM)。
1.2 现有技术回顾
- K - 匿名技术 :提出了用于维护隐私的泛化和抑制规则,确保发布的数据中存在 k 个相似记录的组。
- 微聚合技术 :有多种实现方式,如通过个体排名方法进行微聚合,对每个维度的记录进行排序,建立 k 条记录的关联并使用组聚合替换。
1.3 MNAM 模型
1.3.1 模型原理
现有隐私保护方法引入的噪声会影响聚类识别。MNAM 通过以下公式和步骤解决该问题:
- 定义子空间的上下限:
- (upper(S_{sd}) = u_{dsd})
- (lower(S_{sd}) = l_{dsd})
- ((X’[i][j] < u_{dsd}) \land (X’[i][j] > l_{dsd}))
- 在多维数据集中集成随机噪声:(X[i][j] = X_{sn}[i][j] + random(P))
1.3.2 算法步骤
输入高维数据集 (H)、匿名化程度 (d)、噪声约束 (S)、(g’) 和 (l’),具体步骤如下:
超级会员免费看
订阅专栏 解锁全文
54

被折叠的 条评论
为什么被折叠?



