隐私保护数据集成:解耦数据系统的研究与应用
在数据集成和实体解析的过程中,如何在不泄露真实身份的前提下有效利用数据是一个重要的问题。本文将介绍一项关于解耦数据系统的研究,探讨其在隐私保护和数据集成方面的应用。
1. 研究方法
为了量化不同机制对身份推断的影响,研究人员进行了一项实验。具体操作步骤如下:
1. 设计问题场景 :使用了四个场景来询问两个问题,总共得到八个问题。四个场景分别为:
- 目标学生是常见姓名(如 George Brown)。
- 目标学生是常见姓名且包含出生日期(如 Susan Miller,生于 4/17/1994)。
- 目标学生是罕见姓名(如 Rahul Ghosh)。
- 目标学生是罕见姓名(Rahul Ghosh),且列表中包含不在荣誉榜上的虚假学生姓名。
2. 招募参与者 :通过向不同校园的多个邮件列表发送电子邮件,招募了社会科学和计算科学领域的研究生和研究人员作为参与者。社会科学学生主要来自公共卫生和社会工作领域,计算科学学生主要来自计算机科学、统计学和运筹学领域。
3. 收集数据 :共收到 59 份回复,并收集了参与者的基本人口统计信息和数据经验,具体如下表所示:
| 人口统计信息 | 详情 | 数量 | 占比 |
| ---- | ---- | ---- | ---- |
| 学生身份 | 是 | 50 | 84.75% |
| | 否 | 9 | 15.25% |
| 教育程度 | 学士 | 25 | 42.37% |
超级会员免费看
订阅专栏 解锁全文
28

被折叠的 条评论
为什么被折叠?



