MySQL count(*/column)查询优化

V1ncent-CC

已于 2024-07-30 17:51:56 修改

阅读量1.8k

点赞数 31

分类专栏： MySQL SQL 文章标签： mysql 数据库

于 2024-03-28 19:10:35 首次发布

本文链接：https://blog.youkuaiyun.com/frostlulu/article/details/137121186

版权

MySQL 同时被 2 个专栏收录

45 篇文章

订阅专栏

SQL

13 篇文章

订阅专栏

本文详细介绍了SQL的count()函数，区分了count(*)和count(column)的用法，分享了同时统计多列和利用执行计划的技巧，以及如何在大数据场景下提高性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

count()是SQL中一个常用的聚合函数，其被用来统计记录的总数，下面通过几个示例来说明此类查询的注意事项及应用技巧。

一、count()的含义

count()用于统计符合条件的记录总数，但其有2种用法：count(*)和count(column)

count(*) 统计记录的总数
count(column) 统计column列不为空的记录总数

这里的概念可能和部分人的理解有些偏差，在SQL中“*”通常代表所有列，SQL会通过查询数据字典来将其解析为所有列名，而count(*)并不会这样做，它会是直接统计数量。而count(column)只有在column列不为空的情况下才与count(*)的查询结果相同，因此如果你想统计总记录数，那么直接使用count(*)，count(column)的结果可能会与你想的不同。

示例：count(*)和count(column)的区别

create table test(
id int primary key auto_increment,
name varchar(32)
);
insert into test values(null, 'Vincent'), (null, null);
select * from test;

在这里插入图片描述

表中共2条记录，其中id为2的name是一个空值，查询count(*)和count(name)观察区别：

select count(*), count(name) from test;

在这里插入图片描述

二、count()的应用技巧

由于count()是一个聚合函数，因此它在统计时会扫描符合条件的所有记录，如果我们需要统计多项汇总数据，常规的SQL会一次次的扫描结果集，每次统计出一个结果，而利用一些技巧，我们可以一次扫描统计出多个汇总数据。

2.1 同时统计多列

首先改造一下测试数据，假设这是一张销售明细表，新增产品和价格列：
alter table test add product varchar(32), add price decimal(10,2);
truncate table test;
insert into test values(null,‘Vincent’, ‘Table’, 100),(null,‘Vincent’, ‘Chair’, 50),(null,‘Vincent’, ‘Chair’, 50),(null,‘Victor’, ‘Table’, 100),(null,‘Victor’, ‘Chair’, 50),(null,‘Victor’, ‘Chair’, 50),(null,‘Victor’, ‘Chair’, 50);
select * from test;
在这里插入图片描述

假设现在我有下列问题：

Vincent卖了几件商品？
Victor卖了几件商品？
产品椅子总销量是多少（不分人员）？
所有产品的销售总金额是多少？

由于这几个问题的分组条件都不同，无法用1个group by条件概括。按照常规思路，第1，2个问题应该是count(*)然后group by name，第三个问题应该是count(*) where product=‘Table’，最后在全表扫描一次求出sum(price)，即总金额：

select name,count(*) from test group by name;
select count(*) from test where product='Chair';
select sum(price) from test;

在这里插入图片描述

虽然上面得到了4个问题的答案，但对表查询了3次，假设在生产环境这个表非常大，那么性能必然低下。稍微优化一下，我们可以用一次查询同时回答上面4个问题：

select 
count(name='Vincent' or null) Vincent的销量,
count(name='Victor' or null) Victor的销量,
count(product='Chair' or null) 椅子的总销量,
sum(price) 总销售金额
from test;