大数据匿名化与睡眠质量分析技术解析
大数据匿名化算法研究
现有大数据匿名化方法
在大数据时代,数据隐私保护至关重要,k - 匿名化是其中一种重要的技术。许多研究者提出了不同的算法来实现 k - 匿名化。
- HPSO 聚类 :通过迭代出现的 Map 和 Reduce 阶段,在每个集群上完成 HPSO 聚类活动,直到每个粒子中的统计个体数量超过 k,然后将生成的集群进行泛化转换为匿名形式。
- 混合优化算法 :Madan 和 Goswami 提出了 Dragon - PSO 和 GWO - CSO 方法,其中 Dragon - PSO 将蜻蜓算法(DA)和粒子群优化(PSO)相结合,通过 PSO 调整 DA 的更新过程。此外,他们还提出了基于 K - DDD 级别的匿名模型,包括将原始数据库转换为 k - DDD 数据库,然后在 k - DDD 数据库上应用 D - 遗传算法。
- MapReduce 框架下的算法 :为了解决大数据的可扩展性问题,许多隐私保护算法适用于 MapReduce 框架。该框架通过 map 和 reduce 函数进行计算,将分布式文件系统中的数据分成多个块,分配给 map 函数,生成键/值对列表,然后 Reducer 将适合每个不同键的值合并,将结果写入输出文件。一些研究者还提出了不同的方法来解决匿名化算法的可扩展性问题,如使用可扩展决策树和采样技术、Top - Down 专业化方法、Bottom - up 泛化方法以及基于 Apache spark 的实时大数据匿名化方法。
基于黑洞算法的k-匿名化与睡眠分析
超级会员免费看
订阅专栏 解锁全文
26

被折叠的 条评论
为什么被折叠?



