道路上的独特性:出租车轨迹隐私研究
在当今数字化时代,车辆位置服务(VLBS)应用日益普及,如谷歌地图、Here地图等。然而,这些应用在为我们提供便利的同时,也引发了人们对个人隐私保护的担忧。本文将深入探讨出租车轨迹的独特性以及如何保护其隐私。
1. 研究背景与数据概况
研究采用了两个数据集,分别来自深圳和上海的出租车轨迹数据。具体信息如下表所示:
| 索引 | 日期 | 出租车数量 | 记录数量 |
| — | — | — | — |
| 深圳 | 2011 年 04/18 - 04/26 | 13798 | 130551644 |
| 上海 | 2015 年 04/01 - 04/10 | 13899 | 1141606183 |
从数据中可以看出,上海的出租车每天的轨迹记录概率密度随记录数量的增加而增加,而深圳则相反,上海的出租车每天倾向于有更多的轨迹记录。但需要注意的是,更多的记录并不一定意味着更多的轨迹信息,例如相同数量的记录,时间跨度大的可能包含更多信息。另外,由于出租车公司收集数据时,超过 95% 的相邻记录间隔长度在一小时内,且短时间内收集的记录存在较高冗余,我们可以通过设置时间阈值来合并数据,如将 20 分钟内的移动数据总结为一个时空点。
2. 研究方法与步骤
整个研究过程可以分为四个主要步骤,以下是详细介绍:
graph LR
A[数据预处理] --> B[时间泛化]
B --> C[空间泛化]
C --> D[唯一性计算]
超级会员免费看
订阅专栏 解锁全文
1611

被折叠的 条评论
为什么被折叠?



