B树
B树,也就是多路平衡搜索树,它类似普通的平衡二叉树,不同的是B树允许每个节点有更多的子节点,如下图:
B树有以下特性:
- 所有的键值分布在整棵树中(索引值和具体的data都在每个节点里)。
- 任何一个关键字出现且只出现在一个结点中。
- 搜索有可能在任意一个非叶子结点结束(最好的情况就是O(1))。
- 在关键字全集内做一次性查找,性能逼近二分查找。
B树是专门为外部存储器设计的,如磁盘,它对于读取和写入大块数据有良好的性能,所以一般被用在文件系统及数据库中。
B+树
B+树是B树的变种,也是一种多路搜索树,它和B树的不同之处在于:
- 所有关键字存储在叶子结点处,内部非叶子结点不存储data。
- 为所有叶子增加了一个链指针
简化B+树如下图:
B+树的优点
- 由于B+树的叶子结点数据都是使用链表连接起来的,而且他们在磁盘里都是顺序存储的,磁盘的预读原理就会提前把这些数据读进内存,使得范围查询和排序更快。
- B+树只有叶子结点存data,非叶子结点只有索引值,也就是说在B+树的一次IO里,能读取的索引更多,从而减少查询时需要的IO次数。