比特币匿名性与隐私保护数据集成解析
1. 比特币系统的匿名性问题
比特币社区的技术人员提醒,强匿名性并非比特币系统的主要设计目标。普通用户需要了解这一点,特别是在向那些他们不想公开关联的用户和组织发送比特币时。
2. 隐私保护数据集成的背景
社交网络网站的数据是研究人类行为和互动的优质信息来源。然而,仅使用社交网络网站的数据来解决关于复杂社会的广泛问题存在局限性。能够将在线社交网络数据与其他数据源集成的模型,可以呈现更广阔的图景。
数据集成面临诸多困难,包括不同的格式标准、缺失数据和错误数据。数据常常以不同方式表达(如昵称)、随时间变化(如姓氏)、不是唯一属性(如常见姓名)、缺失(如社保号码)或输入错误。自1959年Newcombe首次提出以来,许多在这些不确定因素下进行记录链接的模型已被研究。所有近似记录链接模型都需要仔细管理链接过程中引入的错误,并手动解决模糊链接。
随着个人数据合并应用的增加,人们对被链接个体的隐私问题日益关注。目前,研究中访问个体层面微观数据仍只有两种模式:
- 去标识模式 :通过去除数据中的个人身份信息(PII)使数据更匿名,但由于无法与其他数据源链接,其在研究中的价值有限。
- 信任模式 :信任政府机构或社会科学家妥善保管委托给他们的PII,并严格用于经IRB批准的目的。但该模式隐私保护不足,数据集成准确性存疑,且存在内部攻击风险。
3. 现有数据访问模式的问题
两种数据访问模式在应用于需要集成数据的广泛研究问题时都存在显著问题:
| 访问模式 | 问题描述 |
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



