2000 年美国人口普查与荷兰统计的统计披露控制策略
在数据统计与发布的过程中,如何在保护个人隐私的同时,为用户提供有价值的信息是一个重要的问题。本文将详细介绍 2000 年美国人口普查以及荷兰统计中所采用的统计披露控制(SDC)策略。
2000 年美国人口普查的 SDC 策略
样本数据处理
- 数据文件类型 :2000 年美国人口普查的公共使用微数据样本(PUMS)有两种文件,分别是 5% 州文件和 1% 特征文件。
- 5% 州文件 :PUMAs 必须包含至少 100,000 人并遵循州边界,该文件包含的部分变量细节少于 1990 年。
- 1% 特征文件 :“超级 - PUMAs”必须包含至少 400,000 人并遵循州边界,该文件的大多数变量细节与 1990 年大致相同。两个文件相互排斥,1% 特征文件于 2002 年发布,5% 州文件因后处理时间长于 2003 年发布。
- 数据修改细节
- 美元金额 :之前精确到美元,2000 年按以下方案四舍五入:
- $1 - 7 = $4
- $8 - $999 四舍五入到最接近的 $10
- $1,000 - $49,000 四舍五入到最接近的 $100
- $50,000 + 四舍
- 美元金额 :之前精确到美元,2000 年按以下方案四舍五入:
2000年人口普查与荷兰SDC策略
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



