目录
1. 前言
参考:https://blog.youkuaiyun.com/z_ryan/article/details/79685072
二叉查找树的查找时间复杂度为O(log(2,N)),其查找效率已经足够高了,那为什么还有B树和B+树的出现呢?难道它两的时间复杂度比二叉查找树还小吗?
IO操作的效率很低,那么,当在大量数据存储中,查询时我们不能一下子将所有数据加载到内存中,只能逐一加载磁盘页,每个磁盘页对应树的节点。造成大量磁盘IO操作(最坏情况下为树的高度)。平衡二叉树由于树深度过大而造成磁盘IO读写过于频繁,进而导致效率低下。
1.1 B树、B+树出现原因?
原因:平衡二叉树是”瘦高“的,即其树的深度相对比较深,而深度越深,会造成读写数据时候磁盘IO的读写过于频繁,进而效率低下。(逻辑环:树深度深 —— 磁盘IO读写频繁 —— 效率低下)。因此,需要一种新的查找树结构,他应该满足:
降低树的深度(让树变得”矮胖“),从而减少磁盘IO读写的次数,提高效率。
1.2 一种新的查找树结构——多路查找树
思路:
1. 每个节点存储多个元素;
2. 采用多叉结构。
根据AVL给我们的启发,一颗平衡多路查找树(B树,Balance Tree)自然可以使得数据的查找效率保证在O(logN)这样的对数级别上。