B+ 树 VS B 树

原创于 2025-07-07 00:19:31 发布 · 922 阅读

·

16

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#数据库 #数据结构 #B+树 #B树

数据库专栏收录该内容

56 篇文章

订阅专栏

B+ 树和 B 树是两种高效的多路平衡搜索树，广泛应用于数据库和文件系统索引。它们的核心差异在于数据存储方式和结构设计，直接影响其在数据库场景下的性能表现。以下是二者的深度对比：

核心差异总结

特性	B 树 (B-Tree)	B+ 树 (B+ Tree)	对数据库的影响
数据存储位置	所有节点均可存储数据	仅叶子节点存储数据	B+ 树非叶节点更紧凑，缓存更高效
叶子节点链接	叶子节点无链表连接	叶子节点双向链表串联	B+ 树支持高效范围查询
非叶节点功能	非叶节点存储数据 + 子节点指针	非叶节点纯索引（只存键值）	B+ 树非叶节点扇出更大，树高更低
搜索稳定性	数据可能在非叶节点找到（不稳定）	数据必须到叶子节点获取	B+ 树查询路径长度固定，性能稳定
空间利用率	节点存储数据导致空间利用率较低	去除非叶节点数据，空间利用率高	B+ 树相同内存可缓存更多索引

结构对比图解

B 树结构

特点：非叶节点存储数据（如 10, 20），数据分散在各层。

B+ 树结构

特点：
1. 非叶节点仅存键值和指针（如 10, 20 是索引）。
2. 叶子节点存储所有数据并双向链接。

为什么数据库选择 B+ 树？

1. 更低的树高 → 更少的磁盘 I/O

原因：B+ 树非叶节点不存储数据，单节点可容纳更多键值（高扇出）。
示例：
- 假设单节点存储 1000 个键值（B+ 树） vs 500 个键值+数据（B 树）。
- 千万级数据：B+ 树高度 = 3（1000³=10⁹），B 树高度 ≥ 4（500⁴=6.25×10⁹）。
- 减少 1 次磁盘 I/O（机械磁盘 I/O 耗时约 10ms）。

2. 范围查询效率碾压 B 树

B+ 树：通过叶子链表顺序扫描（WHERE id BETWEEN 1000 AND 2000）。
B 树：需回溯上层节点，随机跳跃访问。
性能差距：范围查询速度可差 10 倍以上。

3. 全表扫描更高效

B+ 树：遍历叶子链表即得有序数据。
B 树：需层次遍历所有节点（包含非叶节点冗余访问）。

4. 缓存友好性

B+ 树：非叶节点纯索引，可完全载入内存。
示例：16GB 内存的数据库，缓存 10 亿条索引的 B+ 树非叶层仅需约 1GB。

5. 数据一致性更易保证

B+ 树：所有数据在叶子层，事务只需锁定叶子节点。
B 树：数据分散各层，锁管理更复杂。

B 树的优势场景

尽管数据库多用 B+ 树，B 树仍有其适用场景：

内存数据库（如 Redis）：
- 数据全在内存，无磁盘 I/O 问题。
- B 树可直接在非叶节点获取数据，减少指针跳转。
写密集型系统：
- B 树数据分散存储，局部写入可能更快（但需实测验证）。
等值查询为主且无范围需求：
- B 树可能提前终止搜索（非叶节点命中数据）。

性能对比实测（示例）

操作	B 树 (10M 数据)	B+ 树 (10M 数据)	优势比
等值查询（点查）	0.5 ms	0.6 ms	B 树快 20%
范围查询（1%数据）	12 ms	1.2 ms	B+ 树快 10 倍
全表扫描	850 ms	210 ms	B+ 树快 4 倍
插入操作	0.8 ms	1.0 ms	B 树快 25%

注：实测数据因硬件和数据结构参数而异，但趋势一致。

总结：数据库索引的选择

维度	胜出方	原因说明
磁盘 I/O	B+ 树	树高更低，减少寻道次数
范围查询	B+ 树	叶子链表顺序访问 vs B 树随机回溯
缓存效率	B+ 树	非叶节点更紧凑，内存装载更多索引
全表扫描	B+ 树	直接遍历叶子链表 vs 复杂递归
点查速度	B 树	可能提前返回数据（但差距微小）
写性能	B 树	数据分散更新略快（但 B+ 树仍是主流）

结论：

B+ 树凭借更少的磁盘 I/O、高效的范围扫描和缓存友好性，成为数据库索引的绝对统治者。
而 B 树在纯内存操作或特定写场景可能有微弱优势，但无法撼动 B+ 树在持久化存储系统中的核心地位。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。