postgresql:复合索引的最左侧匹配原则

本文深入解析复合索引的概念,探讨其在减少开销、提高查询效率及实现覆盖索引方面的优势,并阐述最左匹配原则及创建复合索引时的列选择策略。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 什么是复合索引

基于表的多列上创建的索引,也叫联合索引。

  • 为什么使用复合索引

减少开销:建一个复合索引(col1,col2,col3),实际相当于建了(col1),(col1,col2),(col1,col2,col3)三个索引。每多一个索引,都会增加写操作的开销和磁盘空间的开销。对于大量数据的表,使用联合索引会大大的减少开销!

覆盖索引:对复合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from newtable where col1=1 and col2=2。可以直接通过遍历索引取得数据,而无需回表,这减少了很多的随机io操作。减少io操作,特别的随机io其实是dba主要的优化策略。所以,在真正的实际应用中,覆盖索引是主要的提升性能的优化手段之一。

效率高:索引列越多,通过索引筛选出的数据越少。有1000W条数据的表,有如下sql:select * from newtable where col1=1 and col2=2 and col3=3,假设假设每个条件可以筛选出10%的数据,如果只有单值索引,那么通过该索引能筛选出1000W10%=100w条数据,然后再回表从100w条数据中找到符合col2=2 and col3= 3的数据,然后再排序,再分页;如果是联合索引,通过索引筛选出1000w10% 10% *10%=1w,效率提升可想而知!

  • 什么是最左匹配原则

最左优先,以查询条件最左边为起点任何连续的索引都能匹配上。同时遇到范围查询(>、<、between、like)就会停止匹配。上面说到建立一个复合索引(col1,col2,col3)相当于建立了三个索引,但除此之外其他的条件组合方式不能使用这个复合索引。

比如:(col1,col3)、(col2m,col3)、(col2)、(col3)这四种条件无法使用索引

Q1:IN查询会不会引起停止匹配

A1:不会

 

Q2: NOT IN查询条件导致索引停止匹配

A2:会,因为NOT IN或者<>会导致索引失效,所以不仅是停止匹配,同时NOT IN字段也不会使用索引

  • 创建复合索引时列的选择原则

  1. 经常用的列优先(最左匹配原则)
  2. 离散度高的列优先(离散度高原则)
  3. 宽度小的列优先(最少空间原则)

列的离散性计算:count(distinct col)/ count(col)

创建复合索引时列的选择原则引自:https://www.cnblogs.com/wangkaihua/p/10220462.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值