Druid动态优先级查询的设计与实现

最新推荐文章于 2024-05-20 09:58:22 发布

原创最新推荐文章于 2024-05-20 09:58:22 发布 · 2.4k 阅读

1 ·

CC 4.0 BY-SA版权

本文深入解析Druid的查询机制，包括broker节点如何分发查询请求，以及历史节点的处理流程。介绍了查询链的构建过程，针对线上业务中小查询速度慢的问题，提出了动态优先级查询的解决方案，并评估了其效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、查询原理介绍

1、Druid broker节点的总体流程

Druid的broker节点是直接提供对外数据查询服务的，它把查询请求分发到实时节点和历史节点，将他们返回的数据做进一步的合并加工然后返回给调用方。它充当着查询路由角色，它存储了每个datasource的每个segment的列表以及在集群节点meta信息，以便于将查询路由至正确的节点。

用户只需要提供固定格式的查询json，向broker 发生http请求，就可以获得broker的查询服务：

上图展示Druid的关键查询过程，其中的主要组件包括：

QueryResource 作为查询的入口，我们在QueryResource上继承一个BrokerQueryResource类用于查询的一些权限控制。

ClientQuerySegmentWalker，根据查询的interval 或者segment构建QueryRunner

QueryRunner 采用了调用链和装饰设计模式，通过嵌套方式实现责任链，每一个最终被转换为一个查询QueryRunner的链表，每一个QueryRunner只负责一段查询。

2、查询链的构建

上图所示，展示broker构建的一个查询链表，每一个查询对应的核心Runner不同（最左端的SpecificQueryRunnable），但是每一个查询还有很多相同的逻辑，比如Metric性能指标的收集，缓存的使用，结果的合并，这些共同的功能被封装在QueryRunner责任链的一个个节点中去处理（如上图中的左边的一些列白色的节点）。