社交网络隐私偏好捕捉研究
1. 隐私设置选项与数据收集
在社交网络隐私设置方面,存在多种细致的选项。参与者可选择部分时间允许请求者访问其位置信息,也能仅允许请求者群体中的部分成员获取位置。此外,参与者还能将显示的位置指定为不准确,但此选项实际使用频率极低(不足 1%)。
1.1 数据收集情况
总共收集了超过 3800 小时的位置信息,其中标记为不准确的审计记录不到 1%。在确定默认隐私政策时,首先关注了一天中的时间和一周中的日期这两个特征。通过不同颜色来表示不同的审计状态,具体如下表所示:
| 审计状态 | 颜色表示 |
| ---- | ---- |
| 允许 | 绿色 |
| 拒绝 | 红色 |
| 位置信息不准确 | 白色 |
| 信息缺失 | 深蓝色 |
信息缺失可能是由于用户未提供该时间段信息,或者将审计标记为“部分群体”。
2. 数据清理
为从数据中学习用户的默认政策,需要处理信息缺失和位置信息不准确的审计记录,并将其分类为“允许”或“拒绝”。分类的主要原因是要将持续时间作为分类器的一个特征,确保几分钟的信息缺失不会影响分类器。不过,这可能会引入两种错误:将拒绝误分类为允许(假阳性),或将允许误分类为拒绝(假阴性)。不同用户因分类错误而产生的不满程度可能不同。
2.1 保守性比率
为考虑用户这种不同程度的不满,引入了保守性比率 κ,其定义为系统错误允许访问时用户的不满程度与系统错误拒绝访问时用户的不满程度之比,即:
[κ = \frac{Unhappiness\ of\ instance\
超级会员免费看
订阅专栏 解锁全文
674

被折叠的 条评论
为什么被折叠?



