什么是索引？为什么使用索引？索引有哪些数据结构？如何使用索引？

严文文-Chris

于 2025-04-15 11:26:22 发布

阅读量361

点赞数 5

分类专栏：数据库文章标签：索引数据库

本文链接：https://blog.youkuaiyun.com/yanwenwennihao/article/details/147245367

版权

数据库专栏收录该内容

31 篇文章

订阅专栏

什么是索引？

索引（Index）是数据库中一种特殊的数据结构，类似于书籍的目录。它通过建立特定列（或列组合）的快速访问路径，帮助数据库系统高效定位数据，避免全表扫描。

为什么使用索引？

核心价值：空间换时间

加速查询
- 时间复杂度从 O(n) 降低到 O(log n)（如B+Tree索引）
- 例：1亿条数据，全表扫描需10秒，索引查询仅需0.01秒
降低I/O消耗
- 索引文件体积通常小于数据文件
- 通过索引定位后，只需读取目标数据页
优化排序与连接
- ORDER BY/GROUP BY 可直接利用索引有序性
- JOIN操作通过索引快速匹配关联键

代价权衡

写操作变慢：每次INSERT/UPDATE/DELETE需维护索引
存储空间增加：索引通常占数据量的20%-30%

索引的数据结构

1. B+Tree（主流选择）

结构特点：
- 多路平衡搜索树，节点存储多个键
- 叶子节点形成有序链表（支持范围查询）
- 非叶子节点仅存键值，不存数据（减少磁盘IO）
适用场景：范围查询（>、<、BETWEEN）、排序、前缀匹配
使用数据库：MySQL（InnoDB）、PostgreSQL

2. 哈希索引

实现原理：键值通过哈希函数映射到桶地址
特点：
- 等值查询O(1)时间复杂度
- 不支持范围查询
- 哈希冲突需处理（链式地址法/开放寻址）
适用场景：内存数据库（如Redis）、精确查询
示例数据库：MySQL MEMORY引擎

3. 全文索引

技术实现：倒排索引（Inverted Index）
核心结构：
- 词典文件（Term Dictionary）
- 倒排列表（Posting List：文档ID + 位置信息）
适用场景：文本内容搜索（如LIKE '%keyword%'优化）
典型应用：Elasticsearch、MySQL全文索引

4. 空间索引（R-Tree）

数据结构：多维空间划分（最小边界矩形MBR）
应用场景：地理数据查询（GIS）、范围相交判断
示例：PostGIS（PostgreSQL扩展）

如何使用索引？

索引的使用方法
不同的数据库系统使用索引的方法略有不同，以下以 MySQL 为例进行说明：

创建索引

-- 创建普通索引
CREATE INDEX index_name ON table_name (column_name);

-- 创建唯一索引
CREATE UNIQUE INDEX index_name ON table_name (column_name);

-- 创建全文索引
CREATE FULLTEXT INDEX index_name ON table_name (column_name);

使用索引进行查询

当执行查询语句时，数据库系统会自动选择合适的索引来优化查询。例如：

-- 查询语句会自动使用索引进行优化
SELECT * FROM table_name WHERE column_name = 'value';

查看索引使用情况

可以使用EXPLAIN关键字来查看查询语句的执行计划，从而了解是否使用了索引以及如何使用索引：

EXPLAIN SELECT * FROM table_name WHERE column_name = 'value';

删除索引

DROP INDEX index_name ON table_name;

需要注意的是，虽然索引可以提高查询效率，但也会带来一些额外的开销，如占用额外的存储空间、增加数据插入、更新和删除操作的时间。因此，在使用索引时需要权衡利弊，合理创建和使用索引。