Lunatory:实时流轨迹聚类框架的创新解决方案
1. 引言
随着支持 GPS 的设备和移动计算服务的普及,大量的轨迹数据被收集用于捕捉车辆的移动情况。轨迹聚类作为许多轨迹分析任务中的基础问题,旨在将大量轨迹分组为几个相对同质的簇,以找到代表性路径或共同的移动趋势。如今,大多数依赖轨迹聚类的应用对时间敏感,因此实时聚类大规模轨迹数据以最大化其价值至关重要。例如,在 COVID - 19 疫情防控中,实时监测和预警高风险区域可以有效减少进一步传播的机会。然而,现有的轨迹聚类方法大多适用于离线场景,难以应用于实时环境。设计实时轨迹聚类面临着一些挑战:
- 实时性保障不足 :当前的轨迹聚类通常使用静态离线轨迹数据集,试图通过大量离线计算来完成操作。但对于实时疫情聚合警报系统而言,离线情况或实时性不足的系统会导致许多延迟判断和不可量化的损失。因此,需要将轨迹分析与分布式流处理引擎(DSPE)深度集成,以最小化数据处理延迟。
- 精度损失 :精度损失体现在两个方面。一是分布式环境会将轨迹整体拆分到不同的物理计算节点,合并时会产生高昂成本或在聚合计算节点造成性能瓶颈;二是难以压缩实时轨迹并设计合理的数据结构来表示其移动特征。
为应对这些挑战,我们提出了 Lunatory,一个用于流轨迹的实时聚类框架。通过将 Lunatory 集成到现有的主流 DSPE 中,能够实现实时轨迹聚类框架,确保轨迹聚类结果的准确性。主要贡献如下:
- 提出在线轨迹聚类框架 Lunatory,兼顾准确性和实时性。
- 通过简化轨迹来表征其特征信息,提出基于 MDL 的轨迹简化算法,然后将简化后的轨迹压缩为枢轴轨迹。
Lunatory:实时流轨迹聚类框架
超级会员免费看
订阅专栏 解锁全文
5488

被折叠的 条评论
为什么被折叠?



