SecWeb:实现隐私保护的实时网页浏览数据发布方案
1. 引言
随着移动设备的爆炸式增长,互联网在人们日常生活中扮演着越来越重要的角色。人们通过浏览各种网站获取感兴趣的信息,而这些浏览行为会被主机服务器记录下来。服务器会将这些浏览历史数据公开,因为这些数据对于公司或第三方研究人员在数据挖掘应用中分析用户浏览行为具有重要价值,例如推荐网页、发现热点新闻以及检测网络异常等。
然而,公开这类隐私敏感数据存在风险。研究表明,用户的网页浏览历史可被视为指纹,用于唯一识别或跟踪用户。例如,AOL数据泄露事件中,记者通过发布的匿名搜索日志迅速识别出用户,导致其敏感信息泄露。即使隐藏了用户的身份信息,攻击者仍有可能通过背景信息推断出用户的浏览历史。
为解决这一问题,差分隐私(Differential Privacy,DP)技术应运而生。它能为统计数据发布提供强大的隐私保护,且无需对攻击者的背景信息做假设。此外,w - 事件差分隐私模型(w - event privacy)可以在连续的w个时间戳内为任何事件序列提供可证明的隐私保证。
本文提出了一种名为SecWeb的在线聚合网页浏览行为监控方案,旨在实现实时网页浏览数据发布的w - 事件隐私保护。具体贡献如下:
- 设计了动态分组机制,将访问量小的网页分组,并向每个组添加拉普拉斯噪声,以消除网页扰动误差的影响。
- 提出自适应采样和预算分配机制,在连续的w个时间戳内为采样点分配合适的隐私预算,并提出预采样机制降低查询敏感度。
- 理论证明SecWeb满足w - 事件差分隐私,并通过实验验证其性能优于现有方法。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



