实时数据流负载均衡与数据库驱动应用测试数据供应方法
在当今的数据处理领域,数据流式管理系统(DSMSs)和数据库驱动应用(DBAPs)扮演着至关重要的角色。DSMSs 负责实时处理高度突发的数据流,而 DBAPs 则依赖数据库来存储和管理数据。然而,这两者在实际应用中都面临着一些挑战,如 DSMSs 的负载均衡问题和 DBAPs 的测试数据供应问题。本文将深入探讨如何利用应用语义进行负载均衡,以及如何为 DBAPs 选择合适的测试数据供应方法。
数据流式管理系统中的负载均衡
数据流式管理系统(DSMSs)在实时处理连续查询(CQs)时,服务质量(QoS)是一个关键因素。为了维持 QoS,人们提出了多种方法,包括容量规划、调度和负载均衡。现有的负载均衡方法主要基于数据或系统特性,如随机丢弃元组或根据系统容量进行调整。然而,这些方法往往没有充分利用应用的语义信息。
以汽车事故检测和通知系统(CarADN)为例,系统可能会因重复通知而产生不必要的开销。当车辆发生事故时,系统会在事故持续期间不断发送通知,即使事故状态未发生变化。这种重复通知不仅增加了系统的负载,还可能导致关键信息的淹没。通过利用应用语义,即避免发送重复通知,可以减少通知数量,降低系统处理的元组数量,从而在不损失准确性和不影响 QoS 的情况下实现负载均衡。
具体来说,在一个简单的查询计划中,涉及选择、二元连接和滑动窗口操作。对于 CarADN 系统,汽车位置数据流的格式为 CarLocStr(timestamp, car id, speed, exp way, lane, dir, segment) 。当两辆汽车发生事故并持续发送位置报告时,查询操作符的输入队列会积累大量
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



