分布式系统查询优化与数字孪生安全数据共享解析
1. 分布式系统查询优化
在分布式系统的查询优化领域,不同的方法各有优劣。Pietzuch 等人采用先优化后放置的方法,但会错过更好的过滤顺序,随着查询规模增大,这一问题愈发明显。Srivastava 等人的方法虽考虑了顺序,但未考虑分布式系统固有的并行性,常将本可并行执行的操作串行化。
而 Shoal 则综合考虑了顺序和放置问题,同时利用分布式系统的并行性,在端到端延迟方面优于其他先进的优化器。其具体优势在于:
- 并行性利用 :优先选择能在多个设备上同时执行工作的计划,充分发挥分布式系统的并行能力。
- 综合优化 :在优化时同时考虑操作顺序和放置位置,避免了其他方法的局限性。
相关工作中,流处理已有诸多研究,如 Aurora、Borealis 和 Twitter Herron 等系统。对于分布式数据库系统中的操作符放置,传统数据库应用主要关注复制、分片或可扩展性。一些优化器和系统在操作符放置和访问控制方面存在不足:
- 部分系统 :将操作符放置与优化分开处理,可能导致次优结果。
- 部分系统 :未考虑数据消费者的访问控制策略。
- 部分系统 :未在优化时考虑不同类型访问控制执行的权衡。
Shoal 提供了一个通用的成本模型和动态规划算法,在查询优化时考虑数据提供者的访问控制执行,通过在每个操作符级别同时对流查询网络进行排序和放置,保证了最优结果。同时,它能根据访问控制的变化,
超级会员免费看
订阅专栏 解锁全文
2117

被折叠的 条评论
为什么被折叠?



