隐私保护与身份管理的技术探索
1. 隐私保护决策树挖掘参数选择
在隐私保护决策树挖掘中,参数选择至关重要。数据所有者可依据代表性领域数据集生成的图表(如Figure 5)来确定扰动矩阵的参数。具体操作步骤如下:
1. 确定可容忍的γ最大值 :基于ρ1到ρ2的隐私泄露度量,结合实际情况,由于较大的γ会降低隐私保护效果,较小的γ会降低准确性,所以建议γ的合理范围是5 ≤γ ≤12。
2. 寻找最高准确率对应的N :对于给定的γ集合(如5 ≤γ ≤12),从图表中为集合中的每个γ找到最高准确率,并确定对应的N。
3. 选择最佳组合 :由此会得到一组γ和N的组合,其中N最小的组合为最佳选择,因为它会产生最小的扰动矩阵,从而降低扰动和分布重建的计算及存储复杂度。
4. 特殊情况处理 :如果属性的域只有d ≤N个不同值,建议为该属性的扰动矩阵选择N = d,此时无需进行离散化。
以下是参数选择流程的mermaid流程图:
graph LR
A[开始] --> B[确定可容忍的γ最大值(5 ≤γ ≤12)]
B --> C[为每个γ找到最高准确率对应的N]
C --> D[选择N最小的γ和N组合]
D --> E{属性域不同值情况}
E -- d ≤N --> F[选择N = d]
E -- d > N --> G[使用所选组合]
F -->
超级会员免费看
订阅专栏 解锁全文
4823

被折叠的 条评论
为什么被折叠?



