PostgreSQL技术内幕（十三）探究MPP数据库分布式查询分发Dispatcher

酷克数据HashData

于 2024-02-20 11:56:38 发布

阅读量1.1k

点赞数 6

文章标签：数据库 postgresql 分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_54979897/article/details/136170681

版权

Dispatcher（分布式查询分发器）是MPP数据库的核心组件，所有的查询任务都要经过其进行分发，起着沟通用户到协调者（Coordinator，即QD）和执行调度的关键作用。

在这次的直播中，我们为大家介绍了Dispatcher基本原理和实现机制，并结合实际用例进行了操作演示。以下内容根据直播文字整理而成。

Slice与Gang的基本概念与分类

传统MPP数据库采用无共享Shared-Nothing架构来存储数据，节点之间不共享存储和计算资源，需要使用其他节点的数据时通常利用网络重分发。

图1：Greenplum数据库查询示意图

（图片来自 Greenplum: A Hybrid Database for Transactional and Analytical Workloads，SIGMOD '21 ，序号和箭头系本文作者所加）

以Greenplum为例，如图1所示，当用户连接到Coordinator（协调者节点）进行查询操作时，会通过Dispatcher组件将查询任务分配到不同的Segment，各Segment之间通过Interconnect模块来传输数据。当各节点查询执行完成后，由QD节点对查询结果进行收集和整理，再回传给用户。

需要注意的是，在查询任务执行时，用户不会和QE产生任何的连接，所有消息都是通过QD 来中转传递，这也是MPP 数据库的重要特征。整个过程中，涉及到两个重要的概念：

Slice：为了在查询执行期间实现最大的并行度，Greenplum会将查询计划工作划分为Slices。Slice是查询计划中可以独立进行处理的部分。查询计划会为Motion生成Slice，Motion的每一侧都有一个Slice。正是由于Motion算子将查询计划分割为一个个Slice，上一层Slice对应的进程会读取下一层各个Slice进程广播或重分布操作生成的数据，然后进行计算。

Gang：属于同一个Slice但是运行在不同的Segment上的进程，称之为Gang。在Greenplum中，共有Unallocated、Reader Gang、Writer Gang、Entry Reader、Singleton Reader五种类型的Gang。其中：

Unallocated运行在QD，一般只在Gather Motion将各个QE回传的结果收取并集时才会用到。

Reader Gang和 Writer Gang会经常用到，而且相关的查询计划会很复杂。

● 只读的查询仅包含 Reader Gang，包含写操作的查询才会使用Writer Gang。

● 一些既读又写的查询（例如 Create table as、Update Returning等）可能同时包含这两类 Gang。

● 这两类 Gang 都只有 1-Gang 和 N-Gang 的情况（

最低0.47元/天解锁文章

酷克数据HashData

博客等级

码龄4年

115
原创

482
点赞

554
收藏

503
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 数据访问效率百倍提升 HashData助力中国石油乘“数”而行

下一篇：: HashData的湖仓一体思考：Iceberg、Hudi特性讲解与支持方案

最新评论

首次 Cloudberry Database 社区聚会 · 北京站，8月3日，诚邀
优快云-Ada助手: 推荐 MySQL入门技能树：https://edu.youkuaiyun.com/skill/mysql?utm_source=AI_act_mysql
酷克数据亮相第13届PostgreSQL中国技术大会，获数据库杰出贡献奖
全栈小5: 写的非常详细，是一篇优质博客，干货满满，让我有了全新的认识，感谢博主分享，让我学到了很多，支持支持。【酷克数据亮相第13届PostgreSQL中国技术大会，获数据库杰出贡献奖，博主这篇文章，值得一看】
酷克数据亮相第13届PostgreSQL中国技术大会，获数据库杰出贡献奖
泡芙萝莉酱: 博主的这篇文章让我对酷克数据在第13届PostgreSQL中国技术大会上获得数据库杰出贡献奖这一事件有了更深入的了解，文章内容详实，让我对这次大会的盛况有了全新的认识。博主的文笔流畅，深度揭示了酷克数据在数据库领域的重要地位，让我受益匪浅。希望博主能够继续分享更多有价值的文章，我会持续关注并期待和博主的交流，共同进步。再次感谢博主的辛苦付出和分享！
PostgreSQL技术内幕（八）源码分析 ——投影算子和表达式计算
优快云-Ada助手: 一定要坚持创作更多高质量博客哦, 小小红包, 以资鼓励, 更多创作活动请看: 毕业季征文·未来可期: https://activity.youkuaiyun.com/creatActivity?id=10429?utm_source=csdn_ai_ada_redpacket 程序员有哪些绝对不能踩的坑？: https://activity.youkuaiyun.com/creatActivity?id=10433?utm_source=csdn_ai_ada_redpacket 新星计划2023: https://marketing.youkuaiyun.com/p/1738cda78d47b2ebb920916aab7c3584?utm_source=csdn_ai_ada_redpacket 全部创作活动: https://mp.youkuaiyun.com/mp_blog/manage/creative?utm_source=csdn_ai_ada_redpacket

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。