纵向分割数据的隐私保护方法概述
1. 引言
在当今时代,数据收集无处不在。随着计算、存储和网络资源的快速增长,数据不仅被收集和存储,还得到了分析。然而,数据隐私问题也日益凸显,个人数据的泄露事件频发,这使得数据的安全共享成为一个严峻的挑战。
数据可以以任意方式分布,常见的有水平分割和垂直分割两种特殊情况。水平分割指不同站点为不同实体收集相同特征的信息,而垂直分割则是不同站点为同一组实体收集不同特征的数据。例如,在医疗研究中,保险公司和医院分别持有患者的不同信息,且这些信息受到隐私和法律的严格保护。
以著名的天气数据集为例,展示了数据的任意分割、水平分割和垂直分割情况。在垂直分割数据的情况下,更多的数据能显著提高模型的质量和数据分析结果的实用性。但同时,垂直分割也增加了隐私保护数据挖掘的复杂性,引发了关于数据处理、结果获取和共享的独特问题。
下面是天气数据集的示例:
| outlook | temperature | humidity | windy | play |
| ---- | ---- | ---- | ---- | ---- |
| sunny | hot | high | false | no |
| sunny | hot | high | true | no |
| overcast | hot | high | false | yes |
| rainy | mild | high | false | yes |
| rainy | cool | normal | false | yes |
| rainy | cool | normal | true | no
超级会员免费看
订阅专栏 解锁全文
15

被折叠的 条评论
为什么被折叠?



