EPiC与节俭通用构造算法解析
在云计算和数据处理领域,数据隐私保护和高效并发处理是两个重要的研究方向。本文将介绍EPiC(Efficient Privacy-Preserving Counting for MapReduce)和节俭通用构造算法,探讨它们在数据处理和并发实现中的应用。
EPiC:高效隐私保护计数算法
EPiC是一种用于MapReduce的高效隐私保护计数算法,其主要目标是在保护外包数据隐私的同时,实现模式计数的功能。通过“ somewhat homomorphic”加密机制,EPiC能够确保云服务提供商在处理数据时,无法获取外包数据的任何信息以及执行的查询内容。
性能评估
- 记录数量影响 :在处理时间不变的情况下,记录数量的增加会使EPiC的计数时间增长。然而,即使对于小记录(如100KB),与非隐私保护计数相比,EPiC的开销仍低于20%,这表明EPiC即使在处理小患者记录时也具有较高的效率。
- 多字段影响 :为研究将单个可计数字段D转换为不同大小的多个字段的效率,进行了数据集大小为100GB的实验,总域大小设置为|D| = 1024(10位)。比较了三种情况:
- 将D转换为10个单二进制字段;
- 将D转换为5个2位的四进制字段;
- 将D转换为3个分别为3位、3位和4位的字段。
实验结果表明,GF(2)算术化方法性能最佳。
- 查询类型影响 :为评估不同
超级会员免费看
订阅专栏 解锁全文
611

被折叠的 条评论
为什么被折叠?



