GBase 8a集群性能优化之group by 多列hash重分布

GBase 8a集群性能优化：多列hash重分布策略

最新推荐文章于 2024-11-05 10:01:22 发布

原创

最新推荐文章于 2024-11-05 10:01:22 发布 · 1.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#dba #数据库 #性能优化

本文介绍了如何通过调整group by的列顺序和启用特定参数来优化GBase 8a集群的性能。当面对大量数据和较少唯一值的group by第一列时，可以通过改变group by的列顺序或启用_group_by多列hash重分布参数，实现更均衡的数据分布，从而提高查询效率。

对随机分布表进行多列group by操作时，集群默认以group by的第一列对表进行hash重分布。当表数据量大，而group by的第一列唯一值较少时，会造成数据重分布到少数的几个节点，达不到多节点并行处理的效果，影响性能。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

pengrander

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PostgreSQL17优化器改进(5)GROUP BY优化

m0_61738548的博客

06-20

1401

本次在PostgreSQL17版本中描述的根据索引或order by排序来优化GROUP BY列的排序，同时新增了enable_group_by_reordering参数进行控制，默认值为on，这里GROUP BY优化其实就是对**分组聚集**实现方式的优化。

gbase mysql集群对比_初识GBase 8a MPP Cluster对分布式执行计划的理解

weixin_39668496的博客

02-23

545

初识GBase 8a MPP Cluster对分布式执行计划的理解说明：学习了三周GBase 8a MPP Cluster相关知识，前段时间参加了孙云吉老师的GBase 8a MPP Cluster explain分布式执行计划相关的培训，个人知识有限，只记录下本人对GBase 8a MPP Cluster分布式执行计划浅显的理解(截图来自于培训内容)。一多表连接操作二 group by操作三优化...

参与评论您还未登录，请先登录后发表或查看评论

GROUP BY 的实现与优化

weixin_33860737的博客

04-23

156

由于GROUP BY实际上也同样需要进行排序操作，而且与ORDER BY相比，GROUP BY主要只是多了排序之后的分组操作。当然，如果在分组的时候还使用了其他的一些聚合函数，那么还需要一些聚合函数的计算。所以，在GROUP BY的实现过程中，与ORDERBY一样也可以利用到索引。在MySQL中，GROUP BY的实现同样有多种（三种）方式，其中有两种方式会利用现有的索引信...

GBase 8a Mpp Cluster集群特性之多列哈希分布

zhu1981hui的博客

09-22

229

•使用uint32保存CRC32的值，如果多个CRC32值相加越界，不影响数据分布。•多列HASH通过将多个列计算的CRC32值相加并对65535取模作为HASH值。•单列HASH通过CRC32函数计算HASH值。

GBase 8a数据库数据重分布过程

kevindaddy的博客

01-19

758

集群有3种状态： Normal(正常模式），ReadOnly（只读模式），Recovery（维护模式）一、扩容在扩容过程中，集群的状态会发生变化，状态变更顺序为： NORMAL -> READONLY -> RECOVERY -> NORMAL Ø 数据准备阶段：集群状态为READONLY，只允许查询。在这个阶段，从原有节点向新的节点进行数据迁移，新节点生成数据副本。 Ø 数据切换阶段：集群状态为RECOVERY，集群不能对外提供任何服务。集群在这个阶段，完成新节点的主分片做表的Ren

SQL优化 - group by优化

最新发布

vonlinee的博客

11-05

678

• 索引的任何其它部分（除了那些来自查询中引用的GROUP BY）必须为常数(也就是说，必须按常量数量来引用它们)，但MIN()或MAX() 函数的参数例外。• GROUP BY包括索引的第1个连续部分(如果对于GROUP BY，查询有一个DISTINCT子句，则所有DISTINCT的属性指向索引开头)。同时，临时表的使用是否可以用索引访问代替，还取决于查询中使用了索引的哪些部分、为这些部分指定的条件以及所选的聚合函数。• 如果使用聚集函数，只能使用MIN()和MAX()，并且它们均指向相同的列。

GBase 8a MPP集群管理之虚拟集群镜像表

sinat_33233315的博客

08-29

694

GBase 8a MPP集群管理之虚拟集群镜像表

GBase 8a-集群日志

huixinhuiyismile的博客

08-12

602

GBase 8a通过集群日志查看执行计划、各阶段整体耗时和各个节点的耗时做性能排查。

gbase8a节点扩容

qq_29151117的博客

05-28

2077

该参数仅在兼容模式下有效，因节点安装后自动调用 addnodes 命令，一般用户无需使用该参数，除非先使用了 gcadmin rmnodes gcChangeInfo.xml 后再添加节点作为 free node。扩容coordinator节点时只需为新节点进行数据库安装操作，新节点根据安装配置文件，指定的信息加入coordiantor集群后，集群内会自动进行元数据的同步和共享。集群安装成功后会自动调用此命令，无需用。多vc模式下，节点加入集群会成为freenode节点，单vc会自动成为数据节点。

group by hash join优化案例

蘑菇丁的专栏

03-28

1865

原本有两个表，其中一个表的数据是150W 另一个表的数据是15W，他们两个hash join后花费的时间很长，后改成半连接后性能明显提升不少 SQL> conn hxy/hxy as sysdba Connected. SQL> create table t1 as select * from dba_objects where rownum Table created. SQL> cr

GBase 8a SQL参考手册

04-03

GBase 8a SQL参考手册.pdf 全面的sql使用手册，查询方便

GBase 8a集群扩展是否可以并行

kevindaddy的博客

02-07

1001

GBase 8a集群的集群扩容时，目前为保证业务不间断采用的是基于表粒度的扩容方式，可以多个表并行同时扩容，也可以一个个表的顺序执行扩容。

再议hash group by

05-27

215

前面提到10.2版本以上hash group by 问题，以下一个帖子中例子也是出现hash group by问题。http://forums.oracle.com/forums/thread.jspa?...

性能调优8：分组聚合 - group by

albh81462的博客

01-15

266

聚合实际上对数据做分组统计，SQL Server使用两种操作符来实现聚合，流聚合（Stream Aggregation）和哈希聚合（Hash aggration）。流聚合是非阻塞性的，具有流的特性，流聚合操作符；边处理数据，边输出聚合的结果。而哈希聚合是阻塞性的，只要处理完所有的数据，才会输出聚合的结果。一，流聚合流聚合要求输入的数据集在group by 即分组列上是有序的，也就...

GBase产品学习-hash分布表

lingzi113的博客

04-26

1153

GBase 8a MPP Cluster执行单个hash分布表select语句，WHERE子句中只有一个hash分布列条件，语句会下发到和条件比较值的hash运算值相匹配的计算节点上。 hash分布表能计算出数据具体落在哪个节点上，所以不是所有节点都查询，只下发到有该数值的节点执行即可。 ...

GBase 数据重分布原理是什么？

lbfk的专栏

03-23

574

集群有 3 中状态： Normal(正常模式），ReadOnly（只读模式），Recovery（维护模式）一、扩容扩容阶段涉及到的状态迁移说明： 1. 数据准备阶段：集群状态由 Normal - > ReadOnly ，这个状态只允许查询。在这个阶段，进行数据迁移。 2. 数据切换阶段：集群状态由 Readonly - >Recovery ，这个状态集群不允许任何动作。这个阶段，新的节点做表的 Rename 动作，旧的节点做表的 Delet

oracle hash 聚合,HASH GROUP BY与SORT GROUP BY

weixin_35102377的博客

04-04

1183

本帖最后由北京大豆于 2013-9-2 18:20 编辑(1).分组算法在10g以前，GROUP BY是通过按照GROUP BY中的列对记录进行排序实现的。10g以后，HASH GROUP BY通过在读取表时将聚合计算在散列表中避免了排序。理论上，HASH GROUP BY应该比SORT GROUP BY速度快很多并消耗更少的内存。然而，HASH GROUP BY的初始实现bug很多。在11....

hash group by导致ORA-600

cuilin2183的博客

07-21

404

今天，在测试一个过程的是遇到一个ORA-00600错误：Errors in file /opt/oracle/admin/citizen/bdump/citizen_j000_25812.trc:ORA-00600: inter...