用户自定义纯边缘数据驱动应用治理案例研究
1. 实验设计
在另外两个实验中,仅使用了最活跃用户的轨迹数据,因为这些用户能从服务中获益最多。实验考虑了社交网络(合成或真实)的存在,这会限制用户间的数据共享。各实验因素取值总结如下表:
| 实验 | 轨迹 | 数据共享配置 |
| — | — | — |
| I | 所有 | 基线、离线、社区(所有用户相互信任)、云微数据中心、云 |
| II | 最活跃用户 | 社区 - m(每个用户信任 m 个其他用户) |
| III | 最活跃用户 | 社区 - real - i(基于 7 个真实社交网络的友谊关系建立信任) |
实验 II 和实验 III 中的社区配置具有随机行为。在实验 II 中,为特定用户 u 提供数据的 m 个用户是从轨迹中随机抽取的;在实验 III 中,广度优先搜索(BFS)算法的起始节点是从社交网络中随机选择的,新图生成后,轨迹中的用户会随机映射到新图的节点上。因此,对于这些设置,重复实验足够多次以产生所需精度的结果,实验 II 重复 50 次,实验 III 重复 500 次。
2. 评估指标
对所提出服务模型的评估重点在于用户在每种配置下可聚合的数据量,这些数据将用于进行预测。具体计算了回答每个请求所使用的历史数据量,以及使用过去数据可以回答的请求比例。
除了关注数据聚合,还展示了一个简单预测算法的示例,更多的数据聚合能带来更好的服务质量(QoS)。为评估服务的 QoS,收集了在公交站的等待时间以及用户未能赶上公交车的请求百分比。
获取的数据量与预测质量之间的关系可能因应用领域、收集数据的特征和使用的预测算法而异。目标不