网络数据隐私风险评估与现实场景焦虑检测研究
1. 网络数据隐私风险评估
1.1 实验数据集
使用斯坦福大学“斯坦福大型网络数据集集合”提供的 Facebook 数据集。该数据集包含节点特征(个人资料)、圈子和自我网络。节点已通过用新值替换每个用户的 Facebook 内部 ID 进行了匿名化处理,特征向量也已提供,但这些特征的解释已被匿名化。聚合所有数据后,得到一个包含 4039 个节点和 88234 条边的社交网络图,大约一半的个体拥有 30 个或更少的朋友/邻居。
1.2 隐私风险评估结果
模拟了不同背景知识配置值(k = 1, 2, 3, 4)下的攻击。将隐私风险离散为六个区间:[0.0],(0.0, 0.1],(0.1, 0.2],(0.2, 0.3],(0.3, 0.5] 和 (0.5, 1.0]。结果表明,随着背景知识配置值 k 的增加,高风险和低风险级别的个体数量通常会增加。对于大多数攻击,当 k 增加到 3 和 4 时会达到一个平台期。其中,邻域标签对攻击导致高风险个体数量大幅增加,而共同朋友攻击相对较弱,在每个 k 值设置下,许多个体都属于隐私风险级别 (0.0, 0.1]。这表明基本的拓扑信息(如直接邻域)足以进行强大的隐私攻击,即使少量信息也可能给整个网络带来重大风险。
| 攻击类型 | 背景知识配置值 k | 低风险个体数量 | 高风险个体数量 |
|---|---|---|---|
| 邻域攻击 | 1 |
超级会员免费看
订阅专栏 解锁全文
52

被折叠的 条评论
为什么被折叠?



