hash group by后导致的cardinality=1问题

最新推荐文章于 2024-11-05 10:01:22 发布

原创最新推荐文章于 2024-11-05 10:01:22 发布 · 631 阅读

0 ·

CC 4.0 BY-SA版权

针对Oracle Database 11g中的一条执行缓慢的SQL语句进行性能调优，发现其性能瓶颈在于hash group by操作导致的cardinality估算错误。通过改写SQL语句并物化中间结果到临时表，显著提升了查询效率。

在做报表性能调优的时候发现一条sql执行很慢，发现主要是由于cardinality估算错误导致

数据库版本： Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64 bi t Production

前一步HASH JOIN后cardinality估算6985，hash group by后竟然变成1，cardinality=1的结果集会导致之后的查询无脑nest loop

分析：个人认为hash group by对cardinality影响应该是group by后估算前一步结果集有多少ndv值，这个值就是这步的cardinality，如下所示

file:///C:/Users/jinlei/AppData/Local/YNote/data/jinleilanqiu@126.com/7c6af05a027b4af6bc079be4fdca1cc1/clipboard.png
那么针对出问题的sql也是一cpsmq.cn
dnsjd.cn
kqklh.cn
nkyny.cn样的，hash group by后cardinality应该<=6623，出现1过为极端

通过改写语句比较差异：

qlypz.cn
wqfpz.cn
wcrfc.cn
yflbb.cn

phqxl.cn
cflls.cn
bxykr.cn
qnhnh.cn

可以发现连接后将结果集物化到临时表后再group by结果相对正确，将group by 字段等价替换成claimkpcgf.cn
hdgrx.cn
kyxkl.cn
ggmqr.cn
yqtby.cn_id后结果也相对kxpsd.cn
gcqbs.cn
jplzy.cn正确

请问各位大神还能从哪些方面去分析hash group by估算错误的具体原因？

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ericdeng2008

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

MySQL高频基本面试问题整理

曾经“等你生日那天”都遥远得像未来，如今却可欢愉的挥手说“下个十年见”

04-07

174万+

总结大厂MySQL高频基本面试问题整理，用于快速查缺补漏

《Hive性能调优实战》摘录

weixin_40503364的博客

05-08

1741

性能调优的多样性 1 SQL优化 union all可以改成两次连续的insert插入可以提高mapreduce性能，但是在之后的版本hive自身做了优化，该方法则并不能再提高性能 2 数据块大小减少map数量，提高网络传输压力有时候可以提高性能 3 不同的数据格式 SequenceFile Parquet ORC 4 表设计如分区，分桶，同时分区分桶排查和调优思路 ...

参与评论您还未登录，请先登录后发表或查看评论

Oracle Hash Group By

cuimidiao3147的博客

11-08

610

Starting with 10g, Oracle introduced “Hash Group By” as the default grouping by mechanism. Or...

10.2版本中hash group by一些争议

02-17

276

10.2中对group by 引入了hash group by替代了sort group by，针对这个新特性，谈谈个人的看法：1、在oracle的白皮书中，推荐使用hash group by，并阐述了性能的优越性...

cardinality mysql_MySQL中Cardinality值的介绍

weixin_35723036的博客

01-19

500

1) 什么是Cardinality不是所有的查询条件出现的列都需要添加索引。对于什么时候添加B+树索引。一般的经验是，在访问表中很少一部分时使用B+树索引才有意义。对于性别字段、地区字段、类型字段，他们可取值范围很小，称为低选择性。如SELECT * FROM student WHERE sex=‘M‘按性别进行查询时，可取值一般只有M、F。因此SQL语句得到的结果可能是该表50%...

再议hash group by

05-27

215

前面提到10.2版本以上hash group by 问题，以下一个帖子中例子也是出现hash group by问题。http://forums.oracle.com/forums/thread.jspa?...

oracle hash 聚合,HASH GROUP BY与SORT GROUP BY

weixin_35102377的博客

04-04

1183

本帖最后由北京大豆于 2013-9-2 18:20 编辑(1).分组算法在10g以前，GROUP BY是通过按照GROUP BY中的列对记录进行排序实现的。10g以后，HASH GROUP BY通过在读取表时将聚合计算在散列表中避免了排序。理论上，HASH GROUP BY应该比SORT GROUP BY速度快很多并消耗更少的内存。然而，HASH GROUP BY的初始实现bug很多。在11....

11g 一个sql案例 hash group by

敖尔其楞的专栏

11-27

2804

处理了一个sql导致的告警问题，这个sql本身的写法是有问题的，这个sql有2个执行计划一个好的，一个不好的，好的执行计划是谓词反馈后，确定了正常的结果集，抛出语句的本身问题，看下oracle是怎么搞错的错误的执行计划 SQL_ID 9z2dtfxqun0xp, child number 5 ------------------------------------- select * from (

Hive HQL面试题(group by和case when)（一）

xiaohu21的博客

09-03

3092

HQL面试题（一） 1. 数据准备 gz.txt 用户工资组成表用户id（uid）, 基本工资（jb）奖金（jj）提成（tc）部门编号（ deptno） 1,2000,3000,1500,1 2,5000,500,1000,2 3,1500,1000,3000,2 4,3000,6000,8000,3 5,1500,2000,1800,1 6,2500,1000,1900,1 bm.txt 部门表 1,销售 2,技术 3,行政 yg.txt 员工信息表

Oracle数据倾斜问题,Oracle数据倾斜导致的问题-有绑定变量

weixin_34957608的博客

04-03

1483

Oracle数据倾斜导致的问题-有绑定变量参考整理---<<恩墨年货-SQL与性能优化>>场景二：在上一节实验可以知道，没有绑定变量时，数据倾斜问题在特定场景下可以用直方图解决，那么在有绑定变量情况下，数据倾斜问题单凭直方图可以解决吗？显然是不能的，Oracle绑定变量技术解决了SQL语句硬解析过多的问题，降低了资源的争用。但是绑定变量在引入cursor sharing，增...

hash group by导致ORA-600

cuilin2183的博客

07-21

405

今天，在测试一个过程的是遇到一个ORA-00600错误：Errors in file /opt/oracle/admin/citizen/bdump/citizen_j000_25812.trc:ORA-00600: inter...

sort group和hash group

码基的博客

07-09

1435

说明：数据库的分组算法有两种，sort group和hash group。前者需要会所有数据进行全局排序，然后在迭代每一条记录时，凡是与上一条记录不一致的，就划分为一个新组。后者则是直接对分组列计算hash值，相同的值会被hash同一组。 MapReduce编程中reduce端shuffle就是典型的sort group。貌似现在传统型数据库的分组，以及hive在map端分组都采用的是hash...

关于hibernate的groupby问题

n554388960的博客

06-12

1847

hibernate学习笔记在hibernate中使用groupby语句返回自定义的对象的时候，返回的格式是List 可以使用如 resultList.get(0)[0]去获得对应的对象的值调用group by的代码 List resultList = openSessionFactory.groupby("book.id,c

group by hash join优化案例

蘑菇丁的专栏

03-28

1866

原本有两个表，其中一个表的数据是150W 另一个表的数据是15W，他们两个hash join后花费的时间很长，后改成半连接后性能明显提升不少 SQL> conn hxy/hxy as sysdba Connected. SQL> create table t1 as select * from dba_objects where rownum Table created. SQL> cr

层级查询高级用法, 执行计划hash group by--工作备忘2016/02/02

Richie's 残酷舞台

02-04

2980

1、

hibernate 关于group by的使用问题

leslieping的博客

12-16

5582

网上找到的关于hibernate group by的使用问题问题： Criteria criteria = baseDao.createCriteria(TbEbillDataDetail.class); criteria.setProjection(Projections.distinct(Projections.property("cardNo"))); 这样虽然是去掉cardN

SQL优化 - group by优化

vonlinee的博客

11-05

681

• 索引的任何其它部分（除了那些来自查询中引用的GROUP BY）必须为常数(也就是说，必须按常量数量来引用它们)，但MIN()或MAX() 函数的参数例外。• GROUP BY包括索引的第1个连续部分(如果对于GROUP BY，查询有一个DISTINCT子句，则所有DISTINCT的属性指向索引开头)。同时，临时表的使用是否可以用索引访问代替，还取决于查询中使用了索引的哪些部分、为这些部分指定的条件以及所选的聚合函数。• 如果使用聚集函数，只能使用MIN()和MAX()，并且它们均指向相同的列。

oracle 10g新增hash group by 算法

cuibao3081的博客

07-12

233

决定hash group by 启用的参数是_gby_hash_aggregation_enabled 。查询是否启动： select ksppinm, ksppstvl from x$ksppi pi, x$kspp...

sort group by和hash group by性能比较

关注系统性能调优

06-08

9457

在10gR2中，group by由以前的sort group by改成了hash group by，这种算法上的改进，取消了sort group by必须进行的排序操作。官方文档上说hash group by的性能强于sort group by，但经过我的测试，不管是逻辑读和cost都是一样的。 SQL>create table test as select * from dba_objects

define view Z_A_Join_C as select from A association [1..1] to B as _B on A.key = _B.key_A association [1..1] to C as _C on _B.key_B = _C.key 这样会报错说_B.key_B不能在这使用，语法错误

最新发布

10-23