29、隐私保护数据集成:理论、方法与实验

隐私保护数据集成:理论、方法与实验

1. 隐私保护研究信息系统

隐私保护研究信息系统是一种具备必要安全协议的信息系统,使研究人员能够访问宇宙 U 中的一个或多个隐私保护信息进行研究。美国人口普查局和疾病控制中心(CDC)的研究数据中心(RDC)就是很好的例子。RDC 是一个信息系统,研究人员可以在受限访问控制下获取微观层面的去标识化数据,用于经批准的研究,并采用了许多安全协议,以提供政府机构要求的最高级别的隐私保护。受限访问是最严格的访问级别,研究人员需要在指定的物理位置使用指定的计算机,并且所有信息的发布都受到全面监控。

2. 隐私保护记录链接模型

2.1 解耦数据访问模型

  • 基本定义 :设 U 是一个包含多个具有多个属性的实体的宇宙,D(n) 是一个有 n 行的表,从宇宙 U 中收集 x 个属性的数据,每行代表宇宙 U 中的一个实体,每列代表一个属性。D[i] 表示表 D 中的第 i 行。
  • PII 表和去标识化表 :给定表 D(n),其 PII 表用 ID(n) 表示,由能明确识别宇宙 U 中实体的属性组成;SD(n) 表示去标识化表,由 D(n) 中不在 ID(n) 中的列组成,即 D(n) = ID(n) + SD(n)。
  • 解耦表 :存在映射函数 recordID(),当且仅当 ID[i] 和 SD[j] 仅包含来自表 D(n) 同一行的值时,recordID(ID[i]) = recordID(SD[j])。解耦表是指 PII 表 ID(n0) 和去标识化表 SD(n),
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值