【数据结构】二叉树、堆多图详解（TopK、堆排序）-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_70503583/article/details/132814961

本文详细介绍了二叉树的基本概念、结构特点，包括树的度、节点关系，以及特殊二叉树如满二叉树和完全二叉树。重点讲解了二叉树的顺序存储结构和堆的概念、结构，涉及堆的向下调整算法、建堆、插入和删除操作，以及堆在堆排序和TopK问题中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述

和光同尘_我的个人主页

应该在肩膀上长着自己的脑袋。 --弗拉基米尔.伊里奇.列宁

🕯️前言

大家好啊，今天我们学习二叉树、堆的相关内容，还是有一点点难度的😵‍💫

1. 数的概念及结构

1.1. 树的概念

树是一种非线性的数据结构，它是由n（n>=0）个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。
有一个特殊的结点，称为根结点，根节点没有前驱结点
除根节点外，其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm，其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱，可以有0个或多个后继
因此，树是递归定义的。

树形结构
在这里插入图片描述

注意：树形结构中，子树之间不能有交集，否则就不是树形结构

1.2.树的相关概念

在这里插入图片描述

名称	概念
节点的度	一个节点含有的子树的个数称为该节点的度；如上图：A的为6
叶节点或终端节点	度为0的节点称为叶节点；如上图：B、C、H、I…等节点为叶节点
非终端节点或分支节点	度不为0的节点；如上图：D、E、F、G…等节点为分支节点
双亲节点或父节点	若一个节点含有子节点，则这个节点称为其子节点的父节点；如上图：A是B的父节点
孩子节点或子节点	一个节点含有的子树的根节点称为该节点的子节点；如上图：B是A的孩子节点
兄弟节点	具有相同父节点的节点互称为兄弟节点；如上图：B、C是兄弟节点
树的度	一棵树中，最大的节点的度称为树的度；如上图：树的度为6
节点的层次	从根开始定义起，根为第1层，根的子节点为第2层，以此类推
树的高度或深度	树中节点的最大层次；如上图：树的高度为4（若根视为0层，高度为3）
堂兄弟节点	双亲在同一层的节点互为堂兄弟；如上图：H、I互为兄弟节点
节点的祖先：	从根到该节点所经分支上的所有节点；如上图：A是所有节点的祖先
子孙	以某节点为根的子树中任一节点都称为该节点的子孙。如上图：所有节点都是A的子孙
森林	由m（m>0）棵互不相交的树的集合称为森林；

是不是很多？我们主要记下加粗的就可以了

1.3. 数的表示

树结构相对线性表就比较复杂了，要存储表示起来就比较麻烦了，既要保存值域，也要保存结点和结点之间的关系，实际中树有很多种表示方式如：双亲表示法，孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。

孩子表示法和循序表存储孩子指针法
左孩子右兄弟表示法

typedef int DataType;
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; // 指向其下一个兄弟结点
DataType _data; // 结点中的数据域
};

双亲表示法

2. 二叉树概念及结构

2.1. 概念

一棵二叉树是结点的一个有限集合，该集合:

或者为空
由一个根节点加上两棵别称为左子树和右子树的二叉树组成
二叉树不存在度大于2的结点（最多2个子节点，也可以是1个或0个）
二叉树的子树有左右之分，次序不能颠倒，因此二叉树是有序树

对于任意的二叉树都是由以下几种情况复合而成的：

2.2. 特殊二叉树

满二叉树：一个二叉树，如果每一个层的结点数都达到最大值，则这个二叉树就是满二叉树。也就是说，如果一个二叉树的层数为K，且结点总数是 2^k-1，则它就是满二叉树。
完全二叉树：完全二叉树是效率很高的数据结构，完全二叉树是由满二叉树而引出来的。对于深度为K的，有n个结点的二叉树，当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。要注意的是满二叉树是一种特殊的完全二叉树。

2.3. 二叉树的性质

若规定根节点的层数为1，则一棵非空二叉树的第i层上最多有2^(i-1)个结点.
若规定根节点的层数为1，则深度为h的二叉树的最大结点数是2^h - 1.
对任何一棵二叉树, 如果度为0其叶结点个数为n0 , 度为2的分支结点个数为n2 ,则有 n0＝n2 ＋1
若规定根节点的层数为1，具有n个结点的满二叉树的深度，h= log (n+1).
对于具有n个结点的完全二叉树，如果按照从上至下从左至右的数组顺序对所有节点从0开始编号，则对
于序号为i的结点有：
● 若i>0，i位置节点的双亲序号：(i-1)/2；i=0，i为根节点编号，无双亲节点
● 若2i+1<n，左孩子序号：2i+1，2i+1>=n否则无左孩子
● 若2i+2<n，右孩子序号：2i+2，2i+2>=n否则无右孩子

2.4. 二叉树的存储结构

2.4.1. 顺序结构

顺序结构存储就是使用数组来存储，一般使用数组只适合表示完全二叉树，因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储，关于堆我们后面的章节会专门讲解。二叉树顺序存储在物理上是一个数组，在逻辑上是一颗二叉树。

只有满二叉树、完全二叉树适合用数组存储

2.4.2. 链式存储

二叉链一般指孩子表示法，三叉链指孩子双亲表示法，这两种方式是二叉树最常见的表示方式，虽然还有孩子兄弟表示法，该种表示方式本质也是二叉链

在这里插入图片描述

3. 二叉树的顺序结构及实现

3.1. 二叉树的顺序结构

普通的二叉树是不适合用数组来存储的，因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储，需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事，一个是数据结构，一个是操作系统中管理内存的一块区域分段。

3.2. 堆的概念和结构

在这里插入图片描述

栈：线性表，后进先出
堆：非线性结构，完全二叉树
小堆：树中任意一个父亲都<=孩子
大堆：树中任意一个父亲都>=孩子
底层：物理结构，数组；逻辑结构，完全二叉树

3.3. 堆的实现

3.3.1. 堆向下调整算法

现在我们给出一个数组，逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提：左右子树必须是一个堆，才能向下调整。

在这里插入图片描述

向下调整流程（以小堆为例）
将父节点与两个孩子中较小的一个进行交换，重复此过程

3.3.2. 向下调整建堆

下面我们给出一个数组，这个数组逻辑上可以看做一颗完全二叉树，但是还不是一个堆，现在我们通过算法，把它构建成一个堆。根节点左右子树不是堆，我们怎么调整呢？这里我们从倒数的第一个非叶子节点的子树开始调整，一直调整到根节点的树，就可以调整成堆。

向下调整建堆流程（以大堆为例）

3.3.3. 向下建堆时间复杂度

向下调整建堆的时间复杂度为O(N)。

3.3.4. 堆的插入（向上调整）

向下调整流程（以小堆为例）
先在堆的末尾插入元素，而后与父节点比较，大于则交换，重复此过程

在这里插入图片描述

3.3.5. 堆的删除（向下调整）

删除堆是删除堆顶的数据，删除堆顶数据，而后将最后一个数据移至堆顶，再进行向下调整算法

删除堆顶数据调整流程（以小堆为例）

3.3.6. 堆的代码实现

3.3.6.1 声明

typedef int HPDataType;
typedef struct Heap
{
	HPDataType* a;
	int size;
	int capacity; 
}Heap;

// 堆的构建
void HeapCreate(Heap* php, HPDataType* a, int n);
// 堆的销毁
void HeapDestory(Heap* php);
// 堆的插入
void HeapPush(Heap* php, HPDataType x);
// 堆的删除
void HeapPop(Heap* php);
// 取堆顶的数据
HPDataType HeapTop(Heap* php);
// 堆的数据个数
int HeapSize(Heap* php);
// 堆的判空
int HeapEmpty(Heap* php);

3.3.6.2. 实现(以小堆为例)

向上调整和向下调整

void AdjustUp(HPDataType* a, int n, int child)
{
	int parent = (child-1)/2;
	while (child > 0)
	{
        //如果孩子小于父亲，进行交换
		if (a[child] < a[parent])
		{
			Swap(&a[parent], &a[child]);
			child = parent;
			parent = (child-1)/2;
		}
		else
		{
			break;
		}
	}
}

void AdjustDown(HPDataType* a, int n, int root)
{
	int parent = root;
	int child = parent*2+1;
	while (child < n)
	{
		// 选左右孩子中较小的一个
		if (child+1 < n && a[child+1] 《 a[child])
		{
			++child;
		}

		//如果孩子小于父亲，进行调整交换 
		if(a[child] < a[parent])
		{
			Swap(&a[child], &a[parent]);
			parent = child;
			child = parent*2+1;
		}
		else
		{
			break;
		}
	}
}

初始化、创建及销毁

void HeapInit(Heap* php)
{
	assert(php);

	php->a = NULL;
	php->capacity = 0;
	php->size = 0;
}

void HeapCreate(Heap* php, int* a, int n)
{
	assert(php);
	assert(a);

	php->a = (HPDataType*)malloc(sizeof(HPDataType) * n);
	if (php->a == NULL)
	{
		perror("malloc failed");
		exit(-1);
	}
	php->capacity = n;
	php->size = n;

	memcpy(php->a, a, sizeof(HPDataType) * n);

	// 向下调整建堆： 从最后一个非叶子节点开始进行调整
	// 最后一个非叶子节点，按照规则： （最后一个位置索引 - 1） / 2
	// 最后一个位置索引： n - 1
	// 故最后一个非叶子节点位置： (n - 2) / 2
	for (int i = (n - 2) / 2; i >= 0; i--)
	{
		AdjustDown(php->a, n, i);
	}
} 

void HeapDestory(Heap* php)
{
	assert(php);

	free(php->a);
	php->capacity = 0;
	php->size = 0;
}

插入数据和删除数据

void HeapPush(Heap* php, HPDataType x)
{
	assert(php);

	//检查容量
	if (php->size == php->capacity)
	{
		int newCapacity = (php->capacity = 0 ? 4 : php->capacity * 2);
		HPDataType* tmp = realloc(php->a, sizeof(HPDataType) * newCapacity);
		if (tmp == NULL)
		{
			perror("realloc failed");
			exit(-1);
		}

		php->a = tmp;
		php->capacity = newCapacity;
	}

	//尾插
	php->a[php->size] = x;
	php->size++;

	//向上调整
	AdjustUp(php->a, php->size - 1);
}

void HeapPop(Heap* php)
{
	assert(php);
	assert(php->size > 0);

	//交换
	Swap(&php->a[0], &php->a[php->size - 1]);
	php->size--;

	//向下调整
	AdjustDown(php->a, php->size, 0);
}

HPDataType HeapTop(Heap* php)
{
	assert(php);
	assert(php->size > 0);

	return php->a[0];
}

int HeapSize(Heap* php)
{
	return php->size;
}

bool HeapEmpty(Heap* php)
{
	assert(php);

	return php->size == 0;
}

void HeapPrint(Heap* php)
{
	int i;
	for (i = 0; i < php->size; ++i)
	{
		printf("%d ", php->a[i]);
	}
	printf("\n");
}

3.4. 堆的应用

3.4.1. 堆排序

升序：建大堆（降序：建小堆）
交换首尾，将根（最大的数）放在数组最后，并且不再调整这个数据（不把这个数据看做堆里的数据）
再把新的根向下调整，建大堆找到下一个最大的数，重复

堆排序流程（升序为例）

void HeapSort(int* a, int n)
{
	// 建堆--向上调整建堆
	//for (int i = 1; i < n; i++)
	//{
	//	AdjustUp(a, i);
	//}

	// 建堆--向下调整建堆 --O(N)
	for (int i = (n-1-1)/2; i >= 0; --i)
	{
		AdjustDown(a, n, i);
	}

	int end = n;
	while (--end)
	{
        //交换首尾，将根（最小的数）放在最后，并且不把这个数据看做堆里的数据
        //在把新的根向下调整，找到下一个最小的数
		Swap(&a[0], &a[end]);

		// 再调整，选出次小的数
		AdjustDown(a, end, 0);
	}
}

3.4.2 TopK问题

前k个最大的元素，则建大小为k的小堆（前k个最小的元素，则建大小为k的大堆）
将剩余的数依次与根进行比较，大于根则替换根进堆向下调整
因为我们建的是小堆，小堆的根是堆中最小的数据，比根大的数据替换根进堆，比根小的数据跳过，所以在遍历数据的过程中，当前堆中的数据就就是目前访问到的数据中最大的k个数据
这种方法的优势在于当数据量十分大，放不进程序时，只需要程序的k个内存

void CreateNDate()
{
	// 造数据
	int n = 10000;
	srand(time(0));
	const char* file = "data.txt";
	FILE* fin = fopen(file, "w");
	if (fin == NULL)
	{
		perror("fopen error");
		return;
	}

	for (size_t i = 0; i < n; ++i)
	{
		int x = rand() % 1000000;
		fprintf(fin, "%d\n", x);
	}

	fclose(fin);
}


void PrintTopK(int k)
{
	FILE* fout = fopen("data.txt","r");
	if (fout == NULL)
	{
		perror("fopen failed");
		return;
	}

	int* minheap = (int*)malloc(sizeof(int) * k);
	if (minheap == NULL)
	{
		perror("malloc failed");
		return;
	}

	//从文件中读取k个数据到数组
	for (int i = 0; i < k; i++)
	{
		fscanf(fout, "%d", &minheap[i]);
	}

	//1.建一个k大小的小堆
	for (int i =(k-2)/2; i >=0; i--)
	{
		ADjustDown(minheap, k, i);
	}

	//遍历文件，大于根，替换后向下调整
	int a = 0;
	while (fscanf(fout, "%d", &a) != EOF)
	{
		if (a > minheap[0])
		{
			minheap[0] = a;
			AdjustDown(minheap, k, 0);
		}
	}

	for (int i = 0; i < k; i++)
	{
		printf("%d ", minheap[i]);
	}
	printf("\n");

	fclose(fout);
}