数据隐私保护:碎片化与加密结合的解决方案
1. 引言
在数据管理领域,关系型数据库是处理受隐私法规约束数据的常见选择。这是因为它具有清晰的数据模型和简单的查询语言,便于设计解决方案。不过,相关模型也能轻松适配其他数据模型的数据保护,如文件记录或 XML 文档。
早期有方案提出结合碎片化和加密来保护数据机密性,将信息存储在两个独立服务器上,并假设服务器无法通信。但在实际情况中,这个假设过于苛刻。而我们的解决方案克服了这些局限,它允许数据存储在单个服务器上,同时尽量减少仅以加密格式呈现的数据量,从而实现高效的查询执行。
后续将介绍三种不同的碎片化设计方法,分别从减少碎片数量、利用属性对的亲和性以及系统的完整查询工作负载配置等方面考虑性能问题。还会引入一个完整的搜索算法来计算满足机密性约束的最优碎片化方案,并针对每种成本模型提出多项式时间的启发式算法。此外,会对加密索引进行管理,分析引入它们对敏感数据的潜在风险。
2. 机密性约束
考虑这样一个场景:要保护的数据用关系模式 $R(a_1, …, a_n)$ 上的单个关系 $r$ 表示,包含所有需要保护的信息。为简单起见,在上下文明确时,用 $R$ 表示关系模式或其属性集。
通过机密性约束来简单而强大地建模隐私需求,机密性约束是属性集,具体定义如下:
- 定义 4.1(机密性约束) :设 $A$ 是一个属性集,$A$ 上的机密性约束 $c$ 可以是:
- 单元素集 ${a} \subset A$,表明该属性的值是敏感的(属性可见性);
- $A$ 的一个属性子集,表明给定属性值之间的关联是敏感的(关联可见性)
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



