隐私量化与泛化层次结构:数据安全与质量的关键考量
在当今数字化时代,数据隐私和安全问题日益凸显。数据提供者与数据存储方(“house”)之间的关系变得尤为重要,如何量化隐私侵犯以及如何优化数据泛化层次结构成为保障数据安全和质量的关键。
隐私侵犯量化
隐私侵犯的量化是评估数据存储方隐私政策是否符合数据提供者隐私偏好的重要步骤。通过具体的例子,我们可以更清晰地理解这一过程。
假设存在两位数据提供者Ted和Bob,他们的隐私侵犯情况如下:
- (Violation_{Ted} = 60 > 50 ⇒ default_{Ted} = 1)
- (Violation_{Bob} = 80 < 100 ⇒ default_{Bob} = 0)
这表明,尽管Bob的隐私在两个维度上受到侵犯,但由于他的敏感度和侵犯阈值的组合设置,他仍然留在系统中。而Ted认为粒度维度上的侵犯非常敏感,且其侵犯阈值较低,因此他将违约并离开系统。由此,违约概率(P(Default))为:
(P(Default) = \frac{0 + 1 + 0}{3} = \frac{1}{3})
隐私政策扩展
在商业环境中,数据提供者提供给数据存储方的信息通常会根据其对第三方的价值形成收入流。因此,数据存储方有动力扩展其隐私政策,以获取更多可出售的信息。然而,随着隐私政策的扩展,数据提供者违约的可能性也会增加,这两者之间存在着权衡关系。
在非商业环境中,效用的衡量方式并非基于收入,而是可能包括成本节约、公共安全、公共卫生等社会效益。为了证明扩展隐私政策的合理性,数据存储方必须通过扩展政策为每个用户获取额
超级会员免费看
订阅专栏 解锁全文

48

被折叠的 条评论
为什么被折叠?



