1.参数是子查询时,使用EXISTS代替IN
有子查询时exists的速度更快一些,如下:
以上两张表数据量都为百万级,sid字段为索引字段,使用not in耗时1分44秒,而使用not exists只耗时15秒,时间差异显著
当连接列上建了索引,使用exists只需要查索引,不需要扫描整张表
2.避免排序
会进行排序的子句
- group by
- order by
- 聚合函数(sum,count,avg,max,min)
- distinct
- 集合运算符(union,ntersect,except)
2.1 能写在where子句里的条件,不要写在having子句里
- group by 会进行排序,事先通过where筛选数据,能减轻排序负担
- where子句可以使用索引,having子句对聚合后生成的视图做筛选,而该视图不会继承源表的索引结构
2.2 在goup by和order by 子句中使用索引
3.在极值函数中使用索引
select max(item) from Items;
--item为索引字段
在字段上建立索引,只需要扫描索引,不需要扫描整张表
4.索引以下情况会失效
- 指定is null 和 is not null
- 使用否定形式 <> != or
- 使用联合索引时,列的顺序和索引的顺序不一致
- 使用like谓词时,不使用前方一致性匹配,而使用like '%a’和like ‘%a%’
- 默认类型转换,不但会使索引失效,还会增加额外性能开销,需进行显式类型转换
5.left join 替换in,提高查询效率
select a.log_id,b.log_id
from a left join b
on a.log_id=b.log_id
where a.req_start_time like '20230228%'
and b.log_id is null;