第22课:Greenplum 的执行计划

本文详细介绍了Greenplum如何改进PostgreSQL的执行计划以适应分布式数据库。讲解了数据在Master和Segment节点的分布,包括哈希分布表、随机分布表和复制分布表的优缺点。同时,讨论了Motion算子在网络通信中的作用,以及在连接操作中的应用,强调了执行计划分布式化时的数据迁移和优化策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Greenplum 是脱胎于 PostgreSQL 的分布式数据库。既然是分布式数据库,原来 PostgreSQL 生成的基于单机数据库的执行计划显然就无法使用了。因此,本章要分析的是 Greenplum 如何改进 PostgreSQL 的执行计划,使其能够在分布式数据库中执行。

数据分布不同了

Greenplum 中有多个结点,最主要的是划分成了 Master 结点和 Segment 结点。每个集群中只有一个 Master 结点,但是可以有多个 Segment 结点,Master 结点负责生成执行计划并协调执行计划的执行,而 Segment 结点负责保存数据。

分布式数据库的数据是分布在不同的结点之上的,PostgreSQL 数据库存在 3 种不同类型的表:

-- 哈希分布表
shzhang=# CREATE TABLE TEST_A(a int, b int, c int, d int) DISTRIBUTED BY (a,b);
CREATE TABLE

-- 随机分布表
shzhang=# CREATE TABLE TEST_B(a int, b int, c int, d int) DISTRIBUTED RANDOMLY;
CREATE TABLE

-- 复制分布表
shzhang=# CREATE TABLE TEST_C(a int, b int, c int, d int) DISTRIBUTED REPLICATED;
CREATE TABLE
  • 哈希分布表: 按照

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值