聚簇索引和非聚簇索引

一、什么是聚集索引,二级索引(非聚集索引)

1、聚集索引和非聚集索引概念

分类含义特点
聚集索引将数据存储和索引放到了一块,索引结构的叶子节点保存了整行数据每张表必须有,且只有一个
非聚集索引将数据和索引分开存储,索引结构的叶子节点关联的是对应的主键可以存在多个

聚集索引选取规则:

  1. 如果存在主键,主键索引就是聚集索引,如图中的id就是主键索引作为聚集索引
  2. 如果不存在主键,将使用第一个唯一(UNIQUE)索引作为聚集索引。
  3. 如果这张表没有主键,或没有合适的唯一索引,则InnoDB会自动生成一个rowid作为隐藏的聚集索引

2、聚集索引和非聚集索引的区别

将上表中的主键索引(聚集索引)拿取出来就是:

所有的key(灰色部分)对应的都是表中的主键

叶子节点保存的是整行的数据(row),也就意味着,绿色部分保存的是表中那一整行的数据,我们通过主键就可以直接查询这一行数据

如果给表中的name属性,添加了一个普通索引(二级索引),那么这个索引的数据结构如下:

所有的key(灰色部分)对应的就是name的值

到了叶子节点上,对应存储的就不是整行数据,而是他们所对应的主键的值

3、什么是回表查询

回表查询,也称(二次查询),当我们执行以下sql时:

select * from user where name = 'Arm';

要通过名称,来查询所有字段,name字段上添加了二级索引(非聚集索引),但是这个二级索引上并没有保存这一行所有字段的信息,所以会先通过二级索引查询到叶子结点上的主键的值,再通过主键,使用主键索引(聚集索引)查询整行row数据

这种先使用二级索引查询到聚集索引的主键,再通过主键查询整行数据,使用了两次索引进行查询的SQL,就称为回表查询

二、什么是覆盖索引

覆盖索引是指查询使用了索引,并且需要返回的列,在该索引中已经能全部找到

如图:

第一条SQL,由于是通过主键id去查询的,所以走的肯定是聚集索引,在叶子节点中就保存了所有信息,所以要查询*,所需要的字段是已经有了的,所以是覆盖索引

第二条SQL,通过name查询id和name,首先name作为索引中的key值,肯定是有的,而name创建的二级索引(非聚集索引)的叶子节点上保存的正好是主键id,那么这条SQL需要的所有列,这个索引中都有,也是覆盖索引

第三条SQL,通过name查询id、name、gender字段,其中gender字段既不是索引的key,也不是叶子节点上的主键;则需要通过查询到的id,再使用一次主键的索引(回表查询),才能查询到整行row,才能获取到这个gender值

很显然,能一次性查出来走覆盖索引的,肯定比走回表查询(走两次索引)的,性能要好很多

要怎么尽量避免回表查询呢?

1、尽量不使用select *,用什么字段查什么字段

2、对于经常查询的字段,考虑建立联合索引(多个字段组合当索引的key,如果查这几个字段,就可以使用覆盖索引了)

附一个题目:MySQL超大分页怎么处理呢?

tb_sku表有1千万数据,分页查询tb_sku表中limit 9000000, 10的所有字段

也就是查询第9000000到9000010条数据,如果直接使用

## 11秒
select * from tb_sku limit 9000000, 10;

耗时11秒,因为在进行分页查询时,如果执行limit 9000000,10 ,此时需要MySQL排序前9000010条记录,仅仅返回第9000000到9000010条数据,其他记录丢弃,排序的代价就很大

那么要怎么解决呢?

优化思路:一般分页查询时,通过创建覆盖索引能够比较好地提高性能,可以通过覆盖索引加子查询形式进行优化

如下:

## 7秒左右
select * 
from tb_sku t,
  (select id from tb_sku order by id limit 9000000, 10) a
where t.id = a.id;

如果表tb_sku非常大(如包含数百万或更多记录),推荐使用SQL 2。它通过子查询减少了主查询的扫描范围,避免了直接跳过大量数据,从而提高了查询效率。即使表中有主键索引,SQL 2的性能也通常优于SQL 1。

如果表较小,或者分页查询的偏移量较小(如LIMIT 100, 10),SQL 1的性能也完全可以接受。

### 索引非聚簇索引的区别 #### 定义 索引(Clustered Index)是指表中的物理数据存储顺序与索引键值的逻辑顺序一致[^3]。这意味着当创建了一个索引后,数据库会按照索引键重新排列实际的数据行位置。 而非聚簇索引(Non-clustered Index),其叶子节点并不包含真正的数据记录本身,而是包含了指向对应数据行的一个指针或者ROWID。这样即使通过非聚簇索引来访问数据,也需要额外的一次查找操作来获取完整的数据行信息。 #### 工作原理 对于 **索引** 来说,由于它决定了表中数据的实际存储方式,所以每张表只能有一个索引。这是因为数据行的位置一旦被固定下来就难以再改变其他排序规则。通常情况下,在InnoDB引擎下主键即默认作为索引存在;如果没有显式定义主键,则会选择一个唯一且非空的字段自动构建为主键并形成索引。 相比之下,**非聚簇索引** 的实现更加灵活多样。它们不会影响原始表格里数据项之间的相对布局关系,只是单纯地建立了一种映射机制用于加速特定类型的检索过程。每当新增加一条新纪录时,只需简单更新相应的辅助索引结构而无需调整整个磁盘文件上的内容摆放格局。 #### 应用场景分析 ##### 索引的应用场合: - 当频繁执行基于某些列值范围内的扫描查询时,采用索引能够显著减少I/O次数从而提高效率[^1]。 - 对于那些经常需要按某种自然顺序读取大量连续行的操作而言非常适合设置成形式。 ##### 非聚簇索引更适合下面这些情况之一者选用: - 如果应用程序主要依赖精确匹配而不是区间搜索的话那么利用覆盖索引技术就可以完全避免回表动作进而提升速度[^2]。 - 存在多维度过滤条件但又不可能全部组合起来构成复合型主关键字的情况下单独设立几个独立的小规模二级索引往往更为经济实用一些. ```sql -- 创建索引的例子 (假设使用的是支持此功能的关系型数据库系统) CREATE TABLE employees ( id INT NOT NULL, name VARCHAR(50), department_id INT, PRIMARY KEY(id) -- 这里的主键实际上就是一种特殊的索引 ); -- 添加非聚簇索引实例 ALTER TABLE employees ADD INDEX idx_department(department_id); ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值