认识堆排序的排序过程

最新推荐文章于 2025-05-22 09:48:48 发布

原创最新推荐文章于 2025-05-22 09:48:48 发布 · 1.5w 阅读

5 ·

CC 4.0 BY-SA版权

数据结构与算法专栏收录该内容

23 篇文章

订阅专栏

堆排序是一种基于选择排序的算法，通过构建最大堆或最小堆实现排序。堆排序的过程包括建立堆、元素交换和重新调整堆。时间复杂度为O(nlog2(n))，空间复杂度为O(1)。相较于直接选择排序，堆排序在效率上有优势，尤其在大型数据集上。本文介绍了堆排序的基本思想、步骤和C++实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1，实用的排序算法：选择排序

（1）选择排序的基本思想是：每一趟（例如第i趟，i=0，1，2，3，……n-2）在后面n-i个待排序元素中选择排序码最小的元素，作为有序元素序列的第i个元素。待到第n-2趟做完，待排序元素只剩下一个，就不用再选了。
（2）三种常用的选择排序方法
1>直接选择排序
2>锦标赛排序
3>堆排序
其中，直接排序的思路和实现都比较简单，并且相比其他排序算法，直接选择排序有一个突出的优势——数据的移动次数少。
（3）直接选择排序简介
1>直接选择排序（select sort）是一种简单的排序方法，它的基本步骤是：
1）在一组元素V[i]~V[n-1]中选择具有最小排序码的元素；
2）若它不是这组元素中的第一个元素，则将它与这组元素中的第一个元素对调；
3）在这组元素中剔除这个具有最小排序码的元素，在剩下的元素V[i+1]~V[n-1]中重复执行1、2步骤，直到剩余元素只有一个为止。
2>直接选择排序使用注意
它对一类重要的元素序列具有较好的效率，这就是元素规模很大，而排序码却比较小的序列。因为对这种序列进行排序，移动操作所花费的时间要比比较操作的时间大的多，而其他算法移动操作的次数都要比直接选择排序来的多，直接选择排序是一种不稳定的排序方法。
3>直接选择排序C++函数代码

//函数功能，直接选择排序算法对数列排序
//函数参数，数列起点，数列终点
void dselect_sort(const int start, const int end) {
	for (int i = start; i < end; ++i) {
		int min_position = i;
		for (int j = i + 1; j <= end; ++j) {	//此循环用来寻找最小关键码
			if (numbers[j] < numbers[min_position]) {
				min_position = j;
			}
		}
		if (min_position != i) {	//避免自己与自己交换
			swap(numbers[min_position], numbers[i]);
		}
	}
}

（4）关于锦标赛排序
直接选择排序中，当n比较大时，排序码的比较次数相当多，这是因为在后一趟比较选择时，往往把前一趟已经做过的比较又重复了一遍，没有把前一趟的比较结果保留下来。
锦标赛排序（tournament sort）克服了这一缺点。它的思想与体育比赛类似，就是把待排序元素两两进行竞赛，选出其中的胜利者，之后胜利者之间继续竞赛，再选出其中的胜利者，然后重复这一过程，最终构造出胜者树，从而实现排序的目的。

2，堆排序的排序过程

（1）个人理解：堆排序是选择排序的一种，所以它也符合选择排序的整体思想。直接选择排序是在还未成序的元素中逐个比较选择，而堆排序是首先建立一个堆（最大堆或最小堆），这使得数列已经“大致”成序，之后只需要局部调整来重建堆即可。建立堆及重建堆这一过程映射到数组中，其实就是一个选择的过程，只不过不是逐个比较选择，而是借助完全二叉树来做到有目的的比较选择。这也是堆排序性能优于直接选择排序的一个体现。
（2）堆排序分为两个步骤：
1>根据初始输入数据，利用堆的调整算法形成初始堆；
2>通过一系列的元素交换和重新调整堆进行排序。
（3）堆排序的排序思路
1>前提，我们是要对n个数据进行递增排序，也就是说拥有最大排序码的元素应该在数组的末端。
2>首先建立一个最大堆*，则堆的第一个元素heap[0]具有最大的排序码，将heap[0]与heap[n-1]对调，把具有最大排序码的元素交换到最后，再对前面n-1个元素，使用堆的调整算法siftDown(0,n-2)，重新建立最大堆。结果具有次最大排序码的元素又浮到堆顶，即heap[0]的位置，再对调heap[0]与heap[n-2]，并调用siftDown(0，n-3)，对前n-2个元素重新调整，……如此反复，最后得到一个数列的排序码递增序列。*
（4）堆排序的排序过程：
下面给出局部调整成最大堆的函数实现siftDown()，这个函数在前面最小堆实现博文中的实现思路已经给出，只需做微小的调整即可用在这里建立最大堆。

//函数功能，自上向下比较将一个集合局部调整为最大堆
//函数参数，调整起始节点，调整最终节点
void max_heap::siftDown(const int start,const int end) {	
	int i = start;
	int j = 2 * i + 1;	//起始节点的左子树
	int temp = heap[i];
	while (j <= end) {	//确定temp最终的位置
		if (j < end && heap[j] < heap[j + 1]) {	//定位到左右子树的较大者
			++j;	
		}
		if (heap[j] <= temp) {	//与当前根值比较
			break;
		}
		else {
			heap[i] = heap[j];
			i = j;
			j = j * 2 + 1;
		}
	}
	heap[i] = temp;
}

下面堆排序函数的实现代码：

//函数功能，堆排序算法对数列递增排序
//函数参数，NULL
void max_heap::heap_sort() {
	for (int cnt = currentSize - 1; cnt > 0; --cnt) {
		swap(heap[0], heap[cnt]);
		siftDown(0, cnt - 1);	//重新调整为最大堆
	}
}

就如同之前说过的思路那样，每次都会把堆顶元素（也就是最大排序码元素）与当前数组末尾的元素交换，最终实现数列的递增排序。
（5）构建堆与堆排序的关系
刚开始，很容易把堆排序和构建堆混为一谈，其实两个概念还是不一样的。构建堆实际上只是完成了堆排序步骤的一部分，因为仅仅构建出最大堆，在完全二叉树的概念上，其数据的确算是有序排列，但是映射到数组中其只是“大致”有序，并不是完全的有序。所以才有后来的交换元素和重新构建的步骤。

3，堆排序算法的性能

（1）通过数学分析可以得出堆排序的时间复杂度是O(nlog2(n))，并且在调整堆的过程中只借助了一个临时存储变量temp，所以其空间复杂度是O(1)。
（2）堆排序借助“堆”这个抽象数据类型实现元素的选择，这使得它比直接选择排序的效率更高。下面我们通过1000个随机数据（范围<1000）的排序，从两种排序算法的执行时间上认识它们的性能。
测试主函数：

int main()
{
	////直接选择排序测试
	//time_t c_start, c_end;
	//produceRandomNumbers(1, 1000, 1000);

	//c_start = clock();
	//dselect_sort(0, 999);
	//c_end = clock();

	//cout << "本次排序所用时间为：" << difftime(c_end, c_start) << "ms" << endl;
	//for (auto value : numbers) {
	//	cout << value << " ";
	//}

	//堆排序测试
	time_t c_start, c_end;
	randomNumbersToArray(1, 1000, 999);

	c_start = clock();
	max_heap heap(data3, 1000);
	heap.heap_sort();
	c_end = clock();
	
	cout << "本次排序所用时间为：" << difftime(c_end, c_start) << "ms" << endl;
	heap.display();

	

	system("pause");
	return 0;
}

（3）打印测试结果：
直接选择排序：
这里写图片描述
堆排序：

（注：两次的测试数据并不同，但是通过多次随机数测试，其值几乎在本次测试附近）

4，堆排序中的ADT构建

（1）堆排序主要借助了一个最大堆的数据结构，然后是其相应的调整成员函数，下面我构建了一个简单的堆排序ADT。
（2）ADT源码：

/*
* 抽象数据类型——最大堆
*/
#ifndef _MAX_HEAP_HEAD_
#define _MAX_HEAP_HEAD_
#include <iostream>
using namespace std;

const int DefaultSize = 10;

class max_heap {
	int* heap;
	int currentSize;
	int maxSize;
	void siftDown(const int start,const int end);
public:
	max_heap(int sz = DefaultSize);
	max_heap(int* h, int sz);
	~max_heap();
	void heap_sort();
	void display() const;
};

//成员函数定义
max_heap::max_heap(int sz) {
	heap = new int[sz];
	if (!heap) {
		cerr << "内存分配失败" << endl;
		exit(EXIT_FAILURE);
	}
	currentSize = 0;
	maxSize = (sz <= DefaultSize) ? DefaultSize : sz;
}

max_heap::max_heap(int* h, int sz) {	
	heap = new int[sz];
	if (!heap) {
		cerr << "内存分配失败" << endl;
		exit(EXIT_FAILURE);
	}
	//初始化成员变量
	currentSize = sz;
	maxSize = (sz <= DefaultSize) ? DefaultSize : sz;
	for (int cnt = 0; cnt < sz; ++cnt) {
		heap[cnt] = h[cnt];
	}
	//调整为最大堆
	int currentPosition = (currentSize - 2) / 2;	//最后一个分支节点——调整起点
	while (currentPosition >= 0) {
		siftDown(currentPosition--, currentSize - 1);
	}
}

max_heap::~max_heap() {
	delete[] heap;
}

//函数功能，自上向下比较将一个集合局部调整为最大堆
//函数参数，调整起始节点，调整最终节点
void max_heap::siftDown(const int start,const int end) {	
	int i = start;
	int j = 2 * i + 1;	//起始节点的左子树
	int temp = heap[i];
	while (j <= end) {	//确定temp最终的位置
		if (j < end && heap[j] < heap[j + 1]) {	//定位到左右子树的较大者
			++j;	
		}
		if (heap[j] <= temp) {	//与当前根值比较
			break;
		}
		else {
			heap[i] = heap[j];
			i = j;
			j = j * 2 + 1;
		}
	}
	heap[i] = temp;
}

//函数功能，堆排序算法对数列递增排序
//函数参数，NULL
void max_heap::heap_sort() {
	for (int cnt = currentSize - 1; cnt > 0; --cnt) {
		swap(heap[0], heap[cnt]);
		siftDown(0, cnt - 1);	//重新调整为最大堆
	}
}

void max_heap::display() const{
	for (int cnt = 0; cnt < currentSize; ++cnt) {
		cout << heap[cnt] << " ";
	}
}


#endif

（注：以上代码可以放在自己命名（如：max_heap.h）的头文件中）

公众号：Dawo