告诉你为什么为什么 SELECT COUNT(*) FROM table 在 InnoDB 引擎中比 MyISAM引擎中的速度慢

最新推荐文章于 2024-07-23 09:42:04 发布

原创最新推荐文章于 2024-07-23 09:42:04 发布 · 818 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#数据库 #mysql #sql

mysql 专栏收录该内容

7 篇文章

订阅专栏

文章探讨了MySQL中InnoDB和MyISAM存储引擎在执行count(*)查询时的性能差异。InnoDB由于其事务处理和MVCC机制，在没有过滤条件的情况下，count(*)操作需要全表扫描，导致速度较MyISAM慢，后者直接存储表的总行数。然而，InnoDB通过选择最小索引树来优化查询，提高效率。在有过滤条件的查询中，两者的性能比较则取决于具体条件。

统计一张表的总数量，是我们开发中常有的业务需求，通常情况下，我们都是使用 select count(*) from table SQL 语句来完成。随着业务数据的增加，你会发现这条语句执行的速度越来越慢，为什么它会变慢呢？

为什么会变慢？想要得到答案就需要知道 MySQL 是如何统计总数量的，先说一个前提吧，count(*) 的具体实现是由存储引擎实现的，也就是说不同的存储引擎实现的方式不一样。标题：为什么select count( * ) from table，在 InnoDB 引擎中比 MyISAM 慢？也是高频面试题。

InnoDB和MyISAM 是我们常用的 MySQL 存储引擎，所以主要对比一下 count(*) 在 InnoDB 和 MyISAM 中的实现：

「在 MyISAM 存储引擎中，把表的总行数存储在磁盘上，当执行 select count(*) from table 时，直接返回总数据」。
「在 InnoDB 存储引擎中，跟 MyISAM 不一样，没有将总行数存储在磁盘上，当执行 select count(*) from table 时，会先把数据读出来，一行一行的累加，最后返回总数量」。

知道了 InnoDB 和 MyISAM 引擎 count(*) 实现之后，为什么select count(*) from table，在 InnoDB 引擎中比 MyISAM 慢？应该有答案了吧，但是这个结论需要有一个前提，就是统计 SQL 不带过滤条件。如果统计数量 SQL 语句为：select count(*) from table where x = 23，那么在 MyISAM 中就不一定比 InnoDB 快了。

「InnoDB 中 count(*) 语句是在执行的时候，全表扫描统计总数量，所以当数据越来越大时，语句就越来越耗时了」，为什么 InnoDB 引擎不像 MyISAM 引擎一样，将总行数存储到磁盘上？这跟 InnoDB 的事务特性有关，由于多版本并发控制（MVCC）的原因，InnoDB 表“应该返回多少行”也是不确定的。

不妨用一个例子来说明一下，假设现在 t 表中有 10000 条数据，现在有三个用户同时访问的会话：

会话 A 先启动事务并查询一次表的总行数。
会话 B 启动事务，插入一行后记录后，查询表的总行数。
会话 C 先启动一个单独的语句，插入一行记录后，查询表的总行数。

会话执行流程表

会话A	会话B	会话C
begin;
select count(*) from table
		insert into table (插入一行)
	begin;
	insert into table(插入一行)
select count(*) from table;(返回10000)	select count(*) from table;(返回10002)	select count(*) from table;(返回10001)

假设从上到下是按照时间顺序执行的，同一行语句是在同一时刻执行的。可以看出在最后时刻，三个会话返回的总行数不一样。

出现不一样的结果跟 InnoDB 存储引擎有关系，「在默认隔离级别可重复读的情况下，通过多版本并发控制（MVCC）来实现，每一行记录都需要判断自己是否对这个会话可见，因此在统计总数量时，InnoDB 只好把数据一行一行的读取出来判断，只有当前会话可见的才纳入统计中」。所以同一时刻不同会话查询到的数量就不一样。

InnoDB 引擎在 count(*)语句上也做了优化，我们知道，在 InnoDB 存储引擎中是以索引组织表的方式存储数据，主键索引树上叶子节点存放在所有的数据，而普通索引树的叶子节点是主键值，所以普通索引树会比主键索引树小很多，但是数量是一样的，也就是说遍历主键索引树和普通索引树得到的结果都是一样的。MySQL 就利用了这一特性，在 InnoDB 中执行 select count(*) from table 语句时，MySQL 优化器会找到最小的那棵索引树来遍历，这样可能就可以减少加载次数，在一定程度上提升了 count(*)的执行效率。