在Mysql 中,GROUP BY 的实现有三种方式:松散索引,紧凑索引,临时文件(文件排序)。其中有两种方式会利用现有的索引信息来完成 GROUP BY,另外一种为完全无法使用索引的场景下使用。
1、使用松散(Loose)索引扫描实现 GROUP BY
松散索引扫描实现 GROUP BY实际上就是当 MySQL 完全利用索引扫描来实现 GROUP BY 的时候,并不需要扫描所有满足条件的索引键即可完成操作得出结果。索引中用于group的字段,没必要包含多列索引的全部字段。例如:有一个索引idx(c1,c2,c3),那么group by c1、group by c1,c2这样c1或c1、c2都只是索引idx的一部分。要注意的是,索引中用于group的字段必须符合索引的“最左前缀”原则。group by c1,c3是不会使用松散的索引扫描的。
要利用到松散索引扫描实现 GROUP BY,需要至少满足以下几个条件:
◆GROUP BY 条件字段需要符合最左前缀索引
◆在使用GROUP BY 的同时,只能使用 MAX 和 MIN 这两个聚合函数
◆如果引用到了该索引中 GROUP BY 条件之外的字段条件的时候,必须以常量形式存在
◆如果查询中有where条件,则条件必须为索引,不能包含非索引的字段。
为什么松散索引扫描的效率会很高?
因为在没有WHERE子句,也就是必须经过全索引扫描的时候, 松散索引扫描需要读取的键值数量与分组的组数量一样多,即比实际存在的键值数目要少很多。而在WHERE子句包含范围判断式或者等值表达式的时候, 松散索引扫描查找满足范围条件的每个组的第1个关键字,并且再次读取尽可能最少数量的关键字。
2.使用紧凑(Tight)索引扫描实现 GROUP BY
紧凑索引扫描实现 GROUP BY 和松散索引扫描的区别:主要在于他需要在扫描索引的时候,读取所有满足条件的索引键,然后再根据读取的数据来完成 GROUP BY 操作,得到相应结果。
在 MySQL 中,MySQL Query Optimizer 首先会选择尝试通过松散索引扫描来实现 GROUP BY 操作,当 GROUP BY 条件字段不是连续或者索引前缀部分的时候,MySQL Query Optimizer 无法使用松散索引扫描之后,才会尝试通过紧凑索引扫描来实现。
3.使用临时表实现 GROUP BY
前面两种 GROUP BY 的实现方式都是在有可以利用的索引的时候使用的,当 MySQL Query Optimizer 无法找到合适的索引可以利用的时候,就不得不先读取需要的数据,然后通过临时表来完成 GROUP BY 操作。
当 MySQL Query Optimizer 发现仅仅通过索引扫描并不能直接得到 GROUP BY 的结果之后,就不得不选择通过将数据存入临时表,然后再进行排序和分组操作来完成 GROUP BY。
本文介绍了MySQL中GROUP BY的三种实现方式:松散索引扫描、紧凑索引扫描和使用临时表。松散索引扫描在满足特定条件时能高效利用索引,而紧凑索引扫描需要读取所有满足条件的索引键。当没有合适索引时,MySQL会借助临时表完成GROUP BY操作。

被折叠的 条评论
为什么被折叠?



