二分法,平衡二叉树、B树、B+树

本文详细介绍了二分法查找、平衡二叉树(包括AVL和红黑树)的概念、构建规则以及B树和B+树的区别,重点讲解了它们在数据查找和存储方面的优势与特性。

二分法

二分法查找

首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一步查找前一子表,否则进一步查找后一子表。重复以上过程,直到找到满足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功

算法要求

必须采用顺序存储结构
必须按关键字大小有序排列

比较次数

计算公式:
当顺序表有n个关键字时:
查找失败时,至少比较a次关键字;查找成功时,最多比较关键字次数是b
a,b,n均为正整数

二分法到二叉树

二分法是我们常用的一种查找算法,可以有效的提升数据找找的效率,其实现思路是:
首先对数据集进行排序
找到数据集中间位置的节点
用查找的条件和中间节点进行比较,等于则直接返回,中间节点数据小于查找条件则说明数据在排序列表的左边,大于则说明数据在排序列表的右边。

平衡二叉树

平衡二叉树概念

平衡二叉树是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。

平衡二叉树的构建规则

(1)非叶子节点只能允许最多两个子节点存在
(2)每一个节点的左边子节点值小于当前节点,右边的子节点值大于当前节点;
(3)通过平衡算法(比如Treap、AVL、红黑树),保证树左右节点的高度相差不超过2层

平衡二叉树特点

平衡二叉树是采用二分法思维把数据按规则组装成一个树形结构的数据,用这个树形结构的数据减少无关数据的检索,大大的提升了数据检索的速度;平衡二叉树的数据结构组装过程有以下规则:

总结平衡二叉树特点:
(1)非叶子节点最多拥有两个子节点;
(2)非叶子节值大于左边子节点、小于右边子节点;
(3)树的左右两边的层级数相差不会大于1;
(4)没有值相等重复的节点;

B树(B-tree)

B树和平衡二叉树的不同之处是:B树属于多叉树又名平衡多路查找树(查找路径不止两个),数据库索引技术里大量使用着B树和B+树的数据结构。

B树的构建规则

(1)排序方式:所有节点关键字是按递增次序排列,并遵循左小右大原则;
(2)子节点数:非叶节点(根节点和枝节点)的子节点数 >1、且子节点数量<=M 、且M>=2,空树除外(注:M阶代表一个树节点最多有多少个查找路径,M=M路,当M=2则是2叉树,M=3则是3叉);
(3)关键字数:枝节点的关键字数量大于等于ceil(m/2)-1个且小于等于M-1个(注:ceil()是个朝正无穷方向取整的函数 如ceil(1.1)结果为2);
(4)所有叶子节点均在同一层、叶子节点除了包含了关键字 和 关键字记录的指针外,也有指向其子节点的指针只不过其指针地址都为null对应下图最后一层节点的空格子;

B树的查询流程

如果我们需要找到E字母,查找流程如下(26个字母顺序)

(1)获取根节点的关键字进行比较,当前根节点关键字为M,E<M(26个字母顺序),所以往找到指向左边的子节点(二分法规则,左小右大,左边放小于当前节点值的子节点、右边放大于当前节点值的子节点);
(2)拿到关键字D和G,D<E<G 所以直接找到D和G中间的节点;
(3)拿到E和F,因为E=E 所以直接返回关键字和指针信息(如果树结构里面没有包含所要查找的节点则返回null);

B+树

B+树是在B树的基础上又一次的改进,其主要对两个方面进行了提升,一方面是查询的稳定性,另外一方面是在数据排序方面更友好。

B+树构建规则

(1)B+树的非叶子节点不保存具体的数据,而只保存关键字的索引,而所有的数据最终都会保存到叶子节点。因为所有数据必须要到叶子节点才能获取到,所以每次数据查询的次数都一样,这样一来B+树的查询速度也就会比较稳定,而B树的查找过程中,不同的关键字查找的次数很有可能都是不同的(有的数据可能在根节点,有的数据可能在最下层的叶节点),所以在数据库的应用层面,B+树就显得更合适
(2)B+树叶子节点的关键字从小到大有序排列,左边结尾数据都会保存右边节点开始数据的指针。因为叶子节点都是有序排列的,所以B+树对于数据的排序有着更好的支持
(3)非叶子节点的子节点数=关键字数

B+树和B树的对比

1、B+树查询速度更稳定:B+所有关键字数据地址都存在叶子节点上,所以每次查找的次数都相同所以查询速度要比B树更稳定

2、B+树天然具备排序功能:B+树所有的叶子节点数据构成了一个有序链表,在查询大小区间的数据时候更方便,数据紧密性很高,缓存的命中率也会比B树高

3、B+树全节点遍历更快:B+树遍历整棵树只需要遍历所有的叶子节点即可,而不需要像B树一样需要对每一层进行遍历,这有利于数据库做全表扫描

4、B树相对于B+树的优点是,如果经常访问的数据离根节点很近,而B树的非叶子节点本身存有关键字和数据,所以在查询这种数据检索的时候会要比B+树快

<think>嗯,用户想了解二叉排序和二叉搜索的区别和联系。首先,我需要确认这两个术语的定义。根据提供的引用,引用[2]、[4]提到二叉搜索、二叉排序、二叉查找是同一概念的不同名称。比如引用[2]明确说“二叉搜索(BST,Binary Search Tree),也称二叉排序或二叉查找”,而引用[4]也指出“二叉排序(Binary Sort Tree)又称二叉查找(搜索)(Binary Search Tree)”。这说明它们是同一个数据结构的不同翻译或称呼,可能没有本质区别。 接下来,用户可能想知道为什么会有不同的名称。可能是中文翻译的不同,比如“排序”和“搜索”对应不同的侧重点,但实际结构特性一致。根据引用中的描述,无论是二叉排序还是二叉搜索,都满足左子节点小于根,右子节点大于根的特性,并且中序遍历得到有序序列。例如引用[2]提到“对二叉搜索进行中序遍历可以得到按关键字排序的有序序列”,这也适用于二叉排序。 然后,我需要检查是否有引用提到两者的区别。但根据提供的资料,所有引用都统一认为它们是同一概念的不同名称,没有提到区别。例如引用[4]直接说“二叉排序又称二叉查找(搜索)”,引用[2]也做了同样的说明。因此可以确定它们是同一数据结构的不同名称,没有本质区别。 此外,用户可能还想了解它们的应用场景和操作,比如查找、插入、删除等。根据引用[5]中的代码示例,二叉搜索的查找操作利用了左小右大的特性,这和二叉排序的操作一致。引用[3]提到二叉查找在大量数据下查询速度较快,这也适用于二叉排序。 总结来说,用户的问题可能源于不同资料中使用不同术语导致的困惑,需要明确两者是同一概念的不同称呼,没有区别。同时,可以进一步解释它们的特性和操作,帮助用户全面理解。</think>### 二叉排序 vs 二叉搜索:定义、区别与联系 #### 1. **定义** - **二叉排序(Binary Sort Tree)** 是一种特殊的二叉结构,满足以下性质: 1. 若左子非空,则左子所有结点的值均小于根结点的值; 2. 若右子非空,则右子所有结点的值均大于根结点的值; 3. 左、右子本身也是二叉排序[^4][^2]。 - **二叉搜索(Binary Search Tree, BST)** 定义与二叉排序完全一致,仅名称不同。其核心性质是通过二分思想实现高效查找、插入和删除操作[^2][^5]。 #### 2. **区别与联系** - **名称差异** - **二叉排序**:强调中序遍历结果是有序序列(即对数据排序的支持)。 - **二叉搜索**:强调基于二分法的快速搜索能力[^3]。 - **本质一致性** 两者是同一数据结构的不同名称,**无本质区别**。中文资料中常将二者混用,英文统称为 *Binary Search Tree (BST)*[^4]。 #### 3. **核心特性** - **有序性**:中序遍历结果为升序序列,例如对 $$T$$ 进行中序遍历可得到 $$a_1 < a_2 < \dots < a_n$$[^4]。 - **高效操作**: - **查找**:时间复杂度为 $O(h)$($h$ 为的高度),最优情况下为 $O(\log n)$(平衡)。 - **插入/删除**:需保持有序性,可能导致结构变化(如调整子)[^5]。 #### 4. **应用场景** 1. 数据库索引结构(如B的基础)。 2. 动态数据集合的快速检索与维护[^5]。 3. 排序算法(通过中序遍历直接输出有序序列)。 #### 5. **代码示例(查找操作)** ```c++ bool Find(const K& key) { Node* cur = _root; while (cur) { if (key < cur->_key) cur = cur->_left; // 左子查找 else if (key > cur->_key) cur = cur->_right; // 右子查找 else return true; // 找到目标 } return false; // 未找到 } ``` ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

测试小姐姐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值