论证select count(*)和select count(1)

今天看到同事转载的一篇《select count(*)和select count(1)的区别》的博文,兴致所致,就想对文中提出的结论进行验证一下:


从内容来看,主要是有主键和没有主键的影响,那么

第一步:创建test1(有主键),test2(无主键)两张表

CREATE TABLE `test1` (
  `id` int(12) NOT NULL AUTO_INCREMENT,
  `value` int(12) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=400000 DEFAULT CHARSET=utf8;

CREATE TABLE `test2` (
  `id` int(12) NOT NULL,
  `value` int(12) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

第二步:插入40万条数据

DROP PROCEDURE inserttest;
CREATE PROCEDURE inserttest()
BEGIN
	DECLARE i INT DEFAULT 1;
	WHILE i < 400000 DO
-- test1表为test1,test2表为test2
		INSERT INTO test1 VALUES(i, i);
		SET i = i+1;
	END WHILE;
END

CALL inserttest;

第三步:论证第一个观点“表没有主键的情况下,count(1)比count(*)快”

我们测试10遍(test2表没有主键,限于篇幅只列出10个)
SELECT SQL_NO_CACHE COUNT(1) as ooo FROM test2;
SELECT SQL_NO_CACHE COUNT(*) as aaa FROM test2;
结果数据
次数count(1)count(*)
1时间: 0.107s时间: 0.105s
2时间: 0.106s时间: 0.105s
3时间: 0.105s时间: 0.106s
4时间: 0.106s时间: 0.106s
5时间: 0.106s时间: 0.108s
6时间: 0.106s时间: 0.103s
7时间: 0.107s时间: 0.106s
8时间: 0.104s时间: 0.103s
9时间: 0.105s时间: 0.105s
10时间: 0.105s时间: 0.110s
结论:该观点不值得相信,从结果数据来看,count(1)比count(*)平均时间可能稍短一点,但是并不总是这样

第四步:论证第二个观点“表在有主键的情况下,主键作为count条件时最快”

我们测试10遍(test1表有主键,限于篇幅只列出10个)
SELECT SQL_NO_CACHE COUNT(1) as ooo FROM test1;
SELECT SQL_NO_CACHE COUNT(*) as aaa FROM test1;
SELECT SQL_NO_CACHE COUNT(id) as aaa FROM test1;
结果数据(忍不住多列了3个)
次数count(1)count(*)count(id)
1时间: 0.052s时间: 0.053s时间: 0.059s
2时间: 0.053s时间: 0.052s时间: 0.060s
3时间: 0.052s时间: 0.052s时间: 0.059s
4时间: 0.052s时间: 0.053s时间: 0.060s
5时间: 0.054s时间: 0.052s时间: 0.059s
6时间: 0.052s时间: 0.054s时间: 0.059s
7时间: 0.051s时间: 0.053s时间: 0.060s
8时间: 0.052s时间: 0.053s时间: 0.061s
9时间: 0.054s时间: 0.053s时间: 0.059s
10时间: 0.071s时间: 0.052s时间: 0.062s
11时间: 0.051s时间: 0.052s时间: 0.059s
12时间: 0.051s时间: 0.052s时间: 0.059s
13时间: 0.052s时间: 0.053s时间: 0.059s
结论:count在表有主键的时候比没有主键的时候快,但是主键作为count条件时最慢,count(1)在多数情况下性能更优。

第五步:本来想论证“表在只有一个字段的时候count(*)最快”,但是很少情况下表只有一个字段,我就不论证了。


第六步:论证“count(*)和count(1)时统计包括null的,而count(列名)不包含null值”

我们先将test1表的value列修改为可以为空
ALTER TABLE `test1`
MODIFY COLUMN `value`  int(12) NULL AFTER `id`;
再将其中13行数据修改为null
UPDATE `test1` SET `value`=NULL WHERE (`id`='13')
通过以下语句
SELECT SQL_NO_CACHE COUNT(1) as ooo FROM test1;
SELECT SQL_NO_CACHE COUNT(*) as aaa FROM test1;
SELECT SQL_NO_CACHE COUNT(id) as aaa FROM test1;
SELECT SQL_NO_CACHE COUNT(value) as aaa FROM test1;
数据证据
count(1)count(*)count(id)count(value)
399999399999399999399998
结论:count(*)和count(1)时统计包括null的,而只有count(有空值的列)不包含null值

第七步:对于select sum(1)的使用介绍,主要是说sum方法的计算结果是参数值1或者其他和满足条件行数的乘积

当然也就是说sum(1)也可以用来统计行数,然后我测试了一下性能(测试有null值并且有主键的表test1),数据如下:
次数count(1)count(*)count(id)count(value)SUM(1)
1时间: 0.052s时间: 0.052s时间: 0.060s时间: 0.091s时间: 0.104s
2时间: 0.054s时间: 0.051s时间: 0.060s时间: 0.090s时间: 0.105s
3时间: 0.053s时间: 0.051s时间: 0.059s时间: 0.093s时间: 0.100s
4时间: 0.052s时间: 0.053s时间: 0.060s时间: 0.094s时间: 0.102s
5时间: 0.051s时间: 0.052s时间: 0.059s时间: 0.091s时间: 0.102s
结论:sum(1)作为统计行数时,性能最差


tips:可能我的测试结果和原作者有不符的地方,如果有理解有误的地方请指正,我使用的是mysql
<think>我们正在讨论SQL中count(1)count(*)的性能区别。根据引用[1]的内容,我们可以看到count(*)count()在性能上可能有显著差异,特别是在有WHERE子句的情况下。在内存中可能只有3倍的性能差异,但在IO密集的场景下,可能有10倍甚至100倍的差异。 但是,我们这里讨论的是count(1)count(*)的区别。实际上,在大多数数据库系统中,count(1)count(*)的性能是相同的,因为优化器会对它们进行相同的处理。 区别主要在于语义: - count(*) 统计的是结果集中的行数,包括所有列都为NULL的行。 - count(1) 统计的是每行中常量为1的个数(即每行都满足条件,所以也是统计行数)。 - count(列名) 统计的是该列不为NULL的行数。 因此,count(*)count(1)都会返回表中的总行数,而count(列名)则返回该列非空值的行数。 关于性能: - 在大多数数据库(如MySQL, Oracle, SQL Server, PostgreSQL)中,count(*)count(1)在性能上没有区别,因为优化器会以相同的方式处理它们。 - 但是,如果使用count(列名),则可能会有所不同,因为数据库需要检查该列是否为NULL。 引用[1]中提到的性能差异主要是针对count(*)count(列名)的比较,而不是count(1)count(*)。 因此,总结如下: 1. 在语义上,count(*)count(1)都是统计行数,结果相同。 2. 在性能上,count(*)count(1)没有区别。 3. count(列名)则不同,它只统计非空值,且性能可能因列的类型索引情况而异。 所以,在编写SQL时,建议使用count(*)来统计行数,因为这是最标准的写法,并且可以清晰地表达意图。 生成相关问题: 1. 在SQL中,count(列名)count(*)有什么区别? 2. 为什么说count(列名)的性能可能比count(*)差? 3. 在哪些情况下,count(列名)会使用索引而count(*)不会? 4. 如何优化大数据表上的count(*)查询? 5. 在MySQL中,MyISAMInnoDB存储引擎对于count(*)的实现有什么不同? 注意:在回答中引用了引用[1],所以我们在末尾添加引用标识[^1]。</think>### `COUNT(1)` vs `COUNT(*)` 性能与区别详解 在 SQL 中,`COUNT(1)` `COUNT(*)` 都是用于统计行数的聚合函数,但存在关键差异: #### 1. **语义区别** - **`COUNT(*)`** 统计**所有行数**,包括 `NULL` 值空行。 示例:`SELECT COUNT(*) FROM users;` → 返回总行数 - **`COUNT(1)`** 统计**常量表达式 `1` 出现的次数**(本质是每行生成一个 `1` 并计数)。 示例:`SELECT COUNT(1) FROM users;` → 结果与 `COUNT(*)` 相同 - **`COUNT(列名)`** 统计**指定列非 NULL 值的数量**(忽略 `NULL`)。 示例:`SELECT COUNT(email) FROM users;` → 只统计非空邮箱 #### 2. **性能对比** | **场景** | `COUNT(*)` | `COUNT(1)` | `COUNT(列名)` | |------------------------|--------------------|--------------------|---------------------| | **无索引表** | 全表扫描 | 全表扫描 | 全表扫描 | | **有索引表** | 优先用索引优化 | 优先用索引优化 | 依赖列索引 | | **WHERE 子句过滤** | 高效(索引利用) | 高效(索引利用) | 可能低效[^1] | | **IO 密集型负载** | 最快 | 等效 `COUNT(*)` | 慢 3-100 倍[^1] | | **结果一致性** | 总行数 | 总行数 | 非 NULL 行数 | > 💡 现代数据库优化器(如 MySQL 8.0+、Oracle、PostgreSQL)会将 `COUNT(1)` `COUNT(*)` **编译为相同执行计划**,性能无差异[^1]。但 `COUNT(列名)` 可能触发额外检查。 #### 3. **使用建议** 1. **统计总行数 → 用 `COUNT(*)`** 最标准写法,意图明确且兼容所有 SQL 标准。 ```sql -- 正确:统计订单总数 SELECT COUNT(*) FROM orders; ``` 2. **统计非 NULL 值 → 用 `COUNT(列名)`** 需明确排除 `NULL` 时使用。 ```sql -- 统计有邮箱的用户数 SELECT COUNT(email) FROM users; ``` 3. **避免 `COUNT(1)`** 无实际优势,且可能引发混淆(新手误以为 `1` 是列名)。 #### 4. **性能优化技巧** - **索引优化**:对 `WHERE` 条件列建索引可加速计数 ```sql CREATE INDEX idx_status ON orders(status); SELECT COUNT(*) FROM orders WHERE status = 'shipped'; -- 索引加速 ``` - **近似计数**(海量数据): ```sql -- PostgreSQL 快速估算 SELECT reltuples FROM pg_class WHERE relname = 'orders'; ``` - **避免全表扫描**: 添加有效过滤条件减少扫描范围。 --- ### 总结 | **函数** | 适用场景 | 性能 | 推荐度 | |--------------|-----------------|-----------|-------| | `COUNT(*)` | 精确统计总行数 | ⭐⭐⭐⭐⭐ | ✅✅✅ | | `COUNT(列名)` | 统计非 NULL 值 | ⭐⭐ (可能慢) | ✅✅ | | `COUNT(1)` | 等效 `COUNT(*)` | ⭐⭐⭐⭐⭐ | ⚠️ 避免 | > 📌 **结论**:**优先使用 `COUNT(*)`**,既符合 SQL 标准又无性能损失。仅在需排除 `NULL` 时用 `COUNT(列名)`,避免使用 `COUNT(1)`。 --- ### 相关问题 1. 为什么 `COUNT(列名)` 在 WHERE 子句存在时性能可能下降? 2. 如何优化千万级数据表的 `COUNT(*)` 查询速度? 3. 在哪些场景下 `COUNT(列名)` 的结果会小于 `COUNT(*)`? 4. MySQL 中 MyISAM InnoDB 引擎对 `COUNT(*)` 的实现有何不同? 5. 如何用执行计划(EXPLAIN)验证 `COUNT` 函数的索引使用情况? [^1]: 引用参考
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

沉默王二

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值