19、数据保护中的掩码后优化与CASC项目解析

掩码后优化与CASC项目解析

数据保护中的掩码后优化与CASC项目解析

在数据保护领域,如何平衡信息损失和披露风险一直是关键问题。本文将介绍掩码后优化方法以及CASC(Computational Aspects of Statistical Confidentiality)项目,探讨它们在数据保护中的应用和效果。

1. 整体评分与数据关联

在数据保护中,我们需要评估掩码后数据集与原始数据集之间的差异。整体评分公式如下:
- 整体评分: Overall score = 0.5 · IL + 0.125 · DLD + 0.125 · PLD + 0.25 · ID
- 简化评分(仅使用DLD记录关联方法): Score = 0.5 · IL + 0.25 · DLD + 0.25 · ID

评分越低,说明方法越好。在计算信息损失(IL)和识别风险(ID)时,需要定义原始数据集X和掩码数据集X′中记录的对应关系。通常,我们使用d维欧几里得距离将每个发布的掩码记录i映射到最近的原始记录c(i)。

2. 掩码后优化

当原始数据集X被掩码为X′后,掩码后优化的目标是将X′修改为X′′,使得X′′尽可能保留X的一阶和二阶矩,同时将IL1保持在规定值附近。

2.1 模型
  • 一阶矩:依赖于 ∑(i=1 to n) xij / n (j = 1, …, d),其中xij是第i条记录中第j个变量的值。
  • 二阶矩:依赖于 ∑(i=1 to n) xij² / n (j = 1, …, d)
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值