group by的原理

本文介绍了MySQL中GROUP BY的三种实现方式:松散索引扫描、紧凑索引扫描和使用临时表。松散索引扫描在满足特定条件时能高效利用索引,而紧凑索引扫描需要读取所有满足条件的索引键。当没有合适索引时,MySQL会借助临时表完成GROUP BY操作。

  在Mysql 中,GROUP BY 的实现有三种方式:松散索引紧凑索引临时文件(文件排序)。其中有两种方式会利用现有的索引信息来完成 GROUP BY,另外一种为完全无法使用索引的场景下使用。

1、使用松散(Loose)索引扫描实现 GROUP BY
  松散索引扫描实现 GROUP BY实际上就是当 MySQL 完全利用索引扫描来实现 GROUP BY 的时候,并不需要扫描所有满足条件的索引键即可完成操作得出结果。索引中用于group的字段,没必要包含多列索引的全部字段。例如:有一个索引idx(c1,c2,c3),那么group by c1、group by c1,c2这样c1或c1、c2都只是索引idx的一部分。要注意的是,索引中用于group的字段必须符合索引的“最左前缀”原则。group by c1,c3是不会使用松散的索引扫描的。
  要利用到松散索引扫描实现 GROUP BY,需要至少满足以下几个条件:
  ◆GROUP BY 条件字段需要符合最左前缀索引
  ◆在使用GROUP BY 的同时,只能使用 MAX 和 MIN 这两个聚合函数
  ◆如果引用到了该索引中 GROUP BY 条件之外的字段条件的时候,必须以常量形式存在
  ◆如果查询中有where条件,则条件必须为索引,不能包含非索引的字段。

  为什么松散索引扫描的效率会很高?
  因为在没有WHERE子句,也就是必须经过全索引扫描的时候, 松散索引扫描需要读取的键值数量与分组的组数量一样多,即比实际存在的键值数目要少很多。而在WHERE子句包含范围判断式或者等值表达式的时候, 松散索引扫描查找满足范围条件的每个组的第1个关键字,并且再次读取尽可能最少数量的关键字。

2.使用紧凑(Tight)索引扫描实现 GROUP BY
  紧凑索引扫描实现 GROUP BY 和松散索引扫描的区别:主要在于他需要在扫描索引的时候,读取所有满足条件的索引键,然后再根据读取的数据来完成 GROUP BY 操作,得到相应结果。
  在 MySQL 中,MySQL Query Optimizer 首先会选择尝试通过松散索引扫描来实现 GROUP BY 操作,当 GROUP BY 条件字段不是连续或者索引前缀部分的时候,MySQL Query Optimizer 无法使用松散索引扫描之后,才会尝试通过紧凑索引扫描来实现。

3.使用临时表实现 GROUP BY
  前面两种 GROUP BY 的实现方式都是在有可以利用的索引的时候使用的,当 MySQL Query Optimizer 无法找到合适的索引可以利用的时候,就不得不先读取需要的数据,然后通过临时表来完成 GROUP BY 操作。
  当 MySQL Query Optimizer 发现仅仅通过索引扫描并不能直接得到 GROUP BY 的结果之后,就不得不选择通过将数据存入临时表,然后再进行排序和分组操作来完成 GROUP BY。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值