基于随机索引的属性推断攻击方法
1. 相关工作
在过去十年里,基于社交媒体上用户可用数据的用户画像受到了极大关注,它是推荐系统的关键组成部分。研究人员对流行的社交媒体平台进行了研究,并利用了所有可能的可用数据,如内容分享、友谊关系、用户行为等,来进行属性推断攻击。例如,有的研究考虑用户的购买数据来同时预测多个人口统计属性;有的展示了攻击者如何利用看似无害的兴趣来揭示用户的敏感信息;还有的表明电影评分推荐系统可以在无需额外元数据的情况下推断用户的性别等。
不过,这些工作主要需要探索用户的邻近网络(如好友列表)和数字记录(如个人资料属性、加入的群组和喜欢的页面),这些数据在实际场景中可能无法获取,或者收集起来计算成本较高。而且,目标用户可以修改这些个人数据和写作风格来逃避推断攻击。
与之不同的是,我们从评论者和Facebook生成的数据(这里都称为发布元数据)中推断目标用户的属性。这些元数据很容易获取,并且我们的方法不需要探索目标用户的邻近网络、群组和页面,因此推断攻击效率高,甚至可以在线发起。我们的工作与从Facebook图片元数据中推断性别和年龄的研究相关,但我们不局限于特定属性,并且通过利用评论者对图片、帖子和状态更新的偏好,我们的攻击适用于许多社交媒体。我们的方法受到了近期分析单词语义随时间变化技术的启发。
2. 分而学之方法论
2.1 符号说明
| 符号 | 描述 |
|---|---|
| D | 收集的训练数据集 |
超级会员免费看
订阅专栏 解锁全文
988

被折叠的 条评论
为什么被折叠?



