聚簇索引（Clustered Index）和非聚簇索引（Non-Clustered Index）

最新推荐文章于 2025-04-15 15:29:40 发布

十五001

最新推荐文章于 2025-04-15 15:29:40 发布

阅读量1k

点赞数 19

分类专栏：基础文章标签： oracle 数据库 mysql

本文链接：https://blog.youkuaiyun.com/zwz1342/article/details/145856621

版权

基础专栏收录该内容

35 篇文章

订阅专栏

数据库中的两种重要索引类型：聚簇索引（Clustered Index）和非聚簇索引（Non-Clustered Index）。这两种索引在数据库中扮演着非常重要的角色，能够显著提高查询性能。

1. 什么是索引？

在讲解聚簇索引和非聚簇索引之前，我们先来了解一下什么是索引。

定义

索引是数据库中的一种数据结构，用于快速定位和访问表中的数据。就像一本书的目录，索引可以帮助数据库管理系统快速找到所需的数据，而不需要扫描整个表。

2. 聚簇索引（Clustered Index）

定义

聚簇索引是一种特殊的索引，它决定了表中数据的物理存储顺序。换句话说，表中的数据会按照聚簇索引的顺序排列。

举个例子

想象一下，你有一本电话簿，电话簿中的联系人是按照姓氏的字母顺序排列的。这种排列方式就是一个聚簇索引。当你查找某个姓氏的联系人时，可以直接定位到大致的位置，而不需要从头到尾翻阅整个电话簿。

特点

数据存储顺序：表中的数据会按照聚簇索引的顺序存储。
每个表只能有一个聚簇索引：因为表的数据只能按照一种顺序存储。
查询效率高：对于范围查询（如SELECT * FROM table WHERE column BETWEEN value1 AND value2），聚簇索引的性能非常好，因为数据是连续存储的。
更新成本高：如果频繁更新聚簇索引列的值，可能会导致数据重新排序，增加维护成本。

示例

假设有一个students表，包含以下列：

id（主键）
name
age

如果将id列设置为聚簇索引：

CREATE TABLE students (
    id INT PRIMARY KEY,
    name VARCHAR(100),
    age INT
);

在这个表中，数据会按照id的顺序存储。

3. 非聚簇索引（Non-Clustered Index）

定义

非聚簇索引是一种独立于表数据存储顺序的索引。它通过一个额外的数据结构（通常是B树）来存储索引键和指向数据行的指针。

举个例子

继续用电话簿的例子。假设你有一本电话簿，除了按照姓氏排列外，还有一份按名字首字母排列的索引。这个索引就是非聚簇索引。当你查找某个名字时，可以通过这个索引快速定位到对应的页码，然后再找到具体的联系人。

特点

独立于数据存储顺序：非聚簇索引不会改变表中数据的物理存储顺序。
可以有多个非聚簇索引：一个表可以有多个非聚簇索引，每个索引可以基于不同的列。
查询效率高：对于点查询（如SELECT * FROM table WHERE column = value），非聚簇索引的性能非常好，因为可以直接定位到具体的行。
维护成本低：更新非聚簇索引列的值不会影响表中数据的物理存储顺序，因此维护成本相对较低。

示例

假设students表中，我们为name列创建一个非聚簇索引：

CREATE INDEX idx_name ON students (name);

这个索引会创建一个独立的B树结构，存储name列的值和指向数据行的指针。

4. 聚簇索引 vs 非聚簇索引

4.1 数据存储

聚簇索引：数据存储顺序与索引顺序一致。
非聚簇索引：数据存储顺序独立于索引顺序。

4.2 查询性能

聚簇索引：对于范围查询非常高效，因为数据是连续存储的。
非聚簇索引：对于点查询非常高效，可以直接定位到具体的行。

4.3 更新成本

聚簇索引：更新索引列的值可能会导致数据重新排序，增加维护成本。
非聚簇索引：更新索引列的值不会影响数据的物理存储顺序，维护成本较低。

4.4 数量限制

聚簇索引：每个表只能有一个聚簇索引。
非聚簇索引：一个表可以有多个非聚簇索引。

5. 应用场景

5.1 聚簇索引

主键索引：通常将主键设置为聚簇索引，因为主键是唯一的，查询性能高。
范围查询：如果经常需要进行范围查询，聚簇索引是一个很好的选择。
排序和分组：如果查询中经常涉及排序和分组操作，聚簇索引可以提高性能。

5.2 非聚簇索引

频繁查询的列：如果某个列经常用于查询条件，但不需要范围查询，可以为其创建非聚簇索引。
多列查询：如果查询条件涉及多个列，可以为这些列创建组合非聚簇索引。
外键列：如果某个列是外键，可以为其创建非聚簇索引，以提高关联查询的性能。

6. 总结

聚簇索引：数据存储顺序与索引顺序一致，适用于范围查询和主键索引。
非聚簇索引：数据存储顺序独立于索引顺序，适用于点查询和多列查询。
选择索引：根据查询需求和表的使用场景选择合适的索引类型。
维护成本：聚簇索引的维护成本较高，非聚簇索引的维护成本较低。