外包数据库上聚合查询的隐私保护计算与验证
1. 引言
隐私问题一直是数据挖掘研究获取敏感数据的主要障碍,也阻碍了多组织间协作数据分析与过滤的实现。许多数据库包含敏感信息,数据所有者可能仅希望允许进行统计或聚合性质的查询。例如,在医疗领域,一组患者的聚合医疗信息可用于研究,但个体患者的医疗记录应严格保密。
如今,数据外包和云计算成为组织数据管理的趋势。数据所有者可将数据委托给第三方服务提供商,减轻自身查询处理负担。然而,这也带来了隐私风险,服务提供商可能不可信,或易受内外部恶意攻击。现有数据外包系统在安全保障和数据所有者隐私需求之间存在差距,无法在计算聚合查询时不向服务提供商透露微观数据。
跨领域协作数据分析也是推动相关研究的应用场景。例如,多个地区医院合作分析当地季节性流感毒株,但现有解决方案要么依赖可信第三方,要么需要参与者在线积极参与,缺乏完全去中心化的实用方案。
本文提出了一种名为 PDAS(隐私保护数据库即服务)的解决方案,用于解决外包数据库上聚合查询的隐私保护和结果验证问题。该方案允许用户验证聚合结果的正确性,同时保护微观数据不被服务提供商和用户知晓。
2. 预备知识
2.1 Shamir 秘密共享方案
在 k - 出 - n 秘密共享方案中,数据所有者将秘密的份额分配给 n 个服务器,使得任意 k 个服务器合作可恢复整个秘密,而少于 k 个服务器则无法恢复。Shamir 秘密共享方案基于多项式插值。假设有 m 个参与者,任意 k 个参与者应能恢复秘密 S。数据所有者选择一个大素数 q,在有限域 Fq 上选择一个随机的 (k - 1) 次多项式 P,使得 P(0) = S。每个参与者
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



