堆的基本认识-优快云博客

堆的基本认识

堆的概念
堆的基本操作
堆排序
向上调整算法和向下调整算法的时间复杂度分析：
TOP-K问题：N个数找最大的前K个。

堆的概念

什么是堆？
1.堆总是一棵完全二叉树。
2.堆中某个结点的值总是不大于或不小于其父结点的值；

大堆和小堆:

大堆：1.完全二叉树
           2.父亲节点的值>=孩子节点
           3.根最大

小堆：1.完全二叉树
           2.父亲节点的值<=孩子节点
           3.根最小。

堆的定义：

typedef int HPDataType;
typedef struct Heap
{
	HPDataType* a;
	int size;
	int capacity;
}HP;

堆的基本操作

1.堆插入数据

void HPPush(HP* php, HPDataType x)
{
	assert(php);
	//扩容
	if (php->size == php->capacity)
	{
		int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2;
		HPDataType* tmp = (HPDataType*)realloc(php->a, newcapacity * sizeof(HPDataType));
		if (tmp == NULL)
		{
			perror("realloc fail");
			return;
		}
		php->a = tmp;
		php->capacity = newcapacity;
	}
	//直接在size除插入数据
	php->a[php->size] = x;
	php->size++;
	AdjustUp(php->a,php->size-1);//插入数据可能需要调整数据
}

2.向上调整（从某个孩子的位置向上调整）

在这里插入图片描述

void AdjustUp(HPDataType* a, int child)
{
	int parent = (child - 1) / 2;
	while (child > 0)
	{
		if (a[child] < a[parent])//小堆：谁小谁当父亲
		{
			Swap(&a[child], &a[parent]);
			child = parent;
			parent = (child - 1) / 2;
		}
		else
		{
			break;
		}
	}
}

拓展：如果有一个数组，如何让它成为一个小堆？

void TestHeap1()
{
	int a[] = { 4,2,8,1,5,6,9,7 };
	HP hp;
	HPInit(&hp);
	for (size_t i = 0; i < sizeof(a) / sizeof(int); i++)
	{
	 HPPush(&hp, a[i]);
	}

}
int main()
{
	TestHeap1();
	return 0;
}

调试结果：
在这里插入图片描述

3.堆的删除：Pop删除，要求删除堆顶的数据（根位置)

首先，我们要清楚，挪动覆盖删除堆顶的数据，关系全乱了，父子变兄弟……

删除堆是删除堆顶的数据，将堆顶的数据根最后一个数据一换，然后删除数组最后一个数据，再进行向下调整算法。
在这里插入图片描述

Pop删除

void HPPop(HP* php)
{
	assert(php);
	assert(php->size > 0);
	Swap(&php->a[0], &php->a[php->size - 1]);
	php->size--;
	AdjustDown(php->a,php->size,0);
}

4.向下调整算法:

void AdjustDown(HPDataType* a, int n, int parent)
{
//要对比左，右孩子的大小
	//假设左孩子小
	int child = parent * 2 + 1;
	//找出小的那个孩子
	while (child < n)//chile>=n,越界了
	{
if (child + 1<n && a[child + 1] < a[child])//右孩子也要n
	{
		++child;
	}
	if (a[child] < a[parent])
	{
		Swap(&a[child], &a[parent]);
		parent = child;
		child = parent * 2 + 1;
	}
	else

	{
		break;
	}
	}
	
}

前面我们所说的，堆的删除是删除堆顶的数据，如果我们需要找出最大或者最小的前k个数据，我们就可以通过Pop数据，找出数据，就不需要通过排序来完成。

堆排序

建堆：
1）向上调整建堆：时间复杂度O(NlogN);

for (int i = 1; i < n; i++)
	{
		AdjustUp(a, i);
	}

2）向下调整建堆：优点：时间复杂度O(N)

for (int i = (n - 1 - 1) / 2; i >= 0; i++)
	{
		AdjustDown(a, n, i);
	}

升序建大堆
降序建小堆

堆排序代码：

void CHeap(int *a,int n)
{
	//建堆（任选一个）
	//向上调整算法
	for (int i = 1; i < n; i++)
	{
		AdjustUp(a, i);
	}
	//向下调整算法
	/*for (int i = (n - 1 - 1) / 2; i >= 0; i++)
	{
		AdjustDown(a, n, i);
	}*/
	int end = n - 1;
	while (end > 0)
	{
		Swap(&a[0],&a[end]);
		AdjustDown(a, end, 0);
		--end;

	}
}

向上调整算法和向下调整算法的时间复杂度分析：

我们先分析满二叉树的时间复杂度范围：

由图可知，满二叉树的时间复杂度度就是O（logN);
拓展：满二叉树最后一排节点数占大约全部二叉树的一半。

向下调整算法的时间复杂度：

在这里插入图片描述

向下调整算法的特点：节点数量多的层 x 调整次数少
节点数量少的层 x 调整次数多
向上调整算法的时间复杂度：

在这里插入图片描述

向上调整算法的特点：节点数量多的层 x 调整次数多
节点数量少的层 x 调整次数少

TOP-K问题：N个数找最大的前K个。

方法1：建一个N个数的大堆 ,再Pop k次
致命缺陷：如果N是10亿个整数，在这10亿个数里面找最大的前10个，我们知道，堆是在内存中开辟的，10亿个整数大概需要4G，太耗内存了。
方法2：用前k个数，建一个小堆，剩下数据跟堆顶数据比较，如果比堆顶数据大，就代替堆顶进入堆，（覆盖根位置，然后向下调整），这个小堆中的k个，就是最大的前k个。