B+Tree索引和Hash索引是MySQL中两种常见的索引类型，它们在数据结构、适用场景、查询性能等方面存在显著区别

本文链接：https://blog.youkuaiyun.com/blog_programb/article/details/147543854

B+Tree索引和Hash索引是MySQL中两种常见的索引类型，它们在数据结构、适用场景、查询性能等方面存在显著区别。以下是详细的对比：

1. 数据结构

B+Tree索引：
- 数据结构：B+Tree是一种多路平衡查找树，所有数据存储在叶子节点上，叶子节点形成一个单向链表。
- 特点：
  - 高度平衡：B+Tree是一个高度平衡的树，查询效率高。
  - 支持范围查询：由于叶子节点形成链表，B+Tree支持范围查询和顺序扫描。
  - 数据存储在叶子节点：所有数据存储在叶子节点上，中间节点只存储键值。
Hash索引：
- 数据结构：Hash索引基于哈希表实现，通过哈希函数将键值映射到哈希表中的位置。
- 特点：
  - 快速查找：通过哈希函数直接定位到数据，查找速度非常快。
  - 不支持范围查询：Hash索引不支持范围查询，只能用于精确匹配。
  - 不支持排序：Hash索引不支持排序操作。

2. 查询性能

B+Tree索引：
- 精确查询：查询效率较高，时间复杂度为O(logN)。
- 范围查询：支持范围查询，时间复杂度为O(logN + K)，其中K是返回的记录数。
- 顺序扫描：支持顺序扫描，适合需要按顺序处理数据的场景。
Hash索引：
- 精确查询：查询效率非常高，时间复杂度为O(1)。
- 范围查询：不支持范围查询，只能用于精确匹配。
- 顺序扫描：不支持顺序扫描，因为哈希表中的数据是无序的。

3. 适用场景

B+Tree索引：
- 范围查询：适用于需要进行范围查询的场景，如SELECT * FROM table WHERE column BETWEEN value1 AND value2。
- 顺序扫描：适用于需要按顺序处理数据的场景，如SELECT * FROM table ORDER BY column。
- 多字段查询：适用于多字段查询，特别是组合索引的场景。
Hash索引：
- 高频率的精确查询：适用于需要频繁进行精确查询的场景，如SELECT * FROM table WHERE column = value。
- 高并发读操作：适用于高并发读操作的场景，因为Hash索引的查找速度非常快。

4. 存储引擎支持

B+Tree索引：
- InnoDB：InnoDB存储引擎默认使用B+Tree索引。
- MyISAM：MyISAM存储引擎也使用B+Tree索引。
Hash索引：
- Memory：Memory存储引擎支持Hash索引。
- InnoDB：InnoDB存储引擎不支持Hash索引，但可以通过HASH索引类型创建辅助索引。

5. 索引的创建

B+Tree索引：

CREATE INDEX idx_btree ON table_name (column_name);

Hash索引：

CREATE INDEX idx_hash ON table_name (column_name) USING HASH;

6. 示例

假设有一个表users，包含字段id（主键）和username（普通字段）。

创建B+Tree索引

CREATE INDEX idx_username_btree ON users (username);

创建Hash索引

CREATE INDEX idx_username_hash ON users (username) USING HASH;

7. 总结

B+Tree索引：
- 优点：支持范围查询和顺序扫描，适用于多字段查询和复杂查询。
- 缺点：查询效率略低于Hash索引，特别是在高并发读操作时。
Hash索引：
- 优点：查询速度非常快，适用于高频率的精确查询和高并发读操作。
- 缺点：不支持范围查询和顺序扫描，适用场景有限。

选择建议

选择B+Tree索引：
- 当需要进行范围查询或顺序扫描时。
- 当表中有多个字段需要联合查询时。
选择Hash索引：
- 当主要进行精确查询时。
- 当需要高并发读操作时。

通过理解B+Tree索引和Hash索引的区别，可以根据具体的应用需求选择合适的索引类型，以实现最佳的查询性能。
在 MySQL 中，B+树索引和哈希索引各有特点，选择哪种索引需要根据具体的业务场景和查询需求来决定，以下为你详细分析不同情况下应选择的索引类型。

适合选择 B+树索引的情况

范围查询

原理：B+树的结构使得它非常适合范围查询。B+树的叶子节点是有序排列的，并且通过指针相连形成一个有序链表。当进行范围查询时，数据库可以从 B+树的某个节点开始，沿着链表顺序遍历，快速定位到符合条件的记录范围。
示例：在一个存储订单信息的表中，经常需要查询某个时间段内的订单，例如查询 2024 年 1 月 1 日到 2024 年 12 月 31 日之间的订单。可以为订单表的 order_date 列创建 B+树索引，这样数据库可以利用 B+树的有序性，快速定位到这个时间段内的订单记录。

-- 为 orders 表的 order_date 列创建 B+树索引
CREATE INDEX idx_order_date ON orders (order_date);

-- 执行范围查询
SELECT * FROM orders WHERE order_date BETWEEN '2024-01-01' AND '2024-12-31';

排序操作

原理：由于 B+树的索引键是有序排列的，在进行排序操作时，数据库可以直接利用 B+树的有序性，避免了额外的排序操作，从而提高查询性能。
示例：在一个用户表中，经常需要按照用户的年龄进行排序查询。可以为用户表的 age 列创建 B+树索引，这样当执行 ORDER BY age 操作时，数据库可以直接利用 B+树的有序性进行排序。

-- 为 users 表的 age 列创建 B+树索引
CREATE INDEX idx_age ON users (age);

-- 执行排序查询
SELECT * FROM users ORDER BY age;

模糊查询（部分情况）

原理：当模糊查询以固定前缀开始时，B+树索引可以发挥作用。因为 B+树的有序性，数据库可以根据前缀快速定位到符合条件的记录范围。
示例：在一个存储商品名称的表中，经常需要查询以“苹果”开头的商品。可以为商品表的 product_name 列创建 B+树索引，这样数据库可以利用 B+树的有序性，快速定位到以“苹果”开头的商品记录。

-- 为 products 表的 product_name 列创建 B+树索引
CREATE INDEX idx_product_name ON products (product_name);

-- 执行模糊查询
SELECT * FROM products WHERE product_name LIKE '苹果%';

适合选择哈希索引的情况

精确匹配查询

原理：哈希索引通过哈希函数将索引键转换为哈希值，然后根据哈希值来定位数据。在进行精确匹配查询时，哈希索引只需要进行一次哈希计算，就可以快速定位到数据所在的位置，查询速度非常快。
示例：在一个存储用户登录信息的表中，经常需要根据用户的用户名精确查找用户信息。可以为用户表的 username 列创建哈希索引，这样当执行 WHERE username = '特定用户名' 查询时，数据库可以利用哈希索引快速定位到该用户的记录。

-- 为 users 表的 username 列创建哈希索引（在支持哈希索引的存储引擎中）
CREATE INDEX idx_username_hash ON users (username) USING HASH;

-- 执行精确匹配查询
SELECT * FROM users WHERE username = 'john_doe';

不需要范围查询

原理：如果查询场景中只涉及精确匹配查询，而不需要进行范围查询，那么哈希索引的高效查找特性可以得到充分发挥。因为哈希索引不支持范围查询，对于不需要范围查询的场景，哈希索引不会带来额外的开销。
示例：在一个存储配置信息的表中，经常需要根据配置项的名称精确查找配置项的值。可以为配置表的 config_name 列创建哈希索引，这样可以提高查询效率。

-- 为 configs 表的 config_name 列创建哈希索引
CREATE INDEX idx_config_name_hash ON configs (config_name) USING HASH;

-- 执行精确匹配查询
SELECT * FROM configs WHERE config_name = 'max_upload_size';