堆排序
- 堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。可以利用数组的特点快速定位指定索引的元素。堆分为大堆和小堆,是完全二叉树。大堆的要求是每个节点的值都不大于其父节点的值,即A[PARENT[i]] >= A[i]。在数组的非降序排序中,需要使用的就是大根堆,因为根据大根堆的要求可知,最大的值一定在堆顶。
- 堆排序利用了大根堆(或小根堆)堆顶记录的关键字最大(或最小)这一特征,使得在当前无序区中选取最大(或最小)关键字的记录变得简单。
(1)用大根堆排序的基本思想
① 先将初始文件R[1…n]建成一个大根堆,此堆为初始的无序区
② 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换,由此得到新的无序区R[1…n-1]和有序区R[n],且满足R[1…n-1].keys≤R[n].key
③由于交换后新的根R[1]可能违反堆性质,故应将当前无序区R[1…n-1]调整为堆。然后再次将R[1…n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换,由此得到新的无序区R[1…n-2]和有序区R[n-1…n],且仍满足关系R[1…n-2].keys≤R[n-1…n].keys,同样要将R[1…n-2]调整为堆。
……
直到无序区只有一个元素为止。
(2)大根堆排序算法的基本操作:
①建堆,建堆是不断调整堆的过程,从len/2处开始调整,一直到第一个节点,此处len是堆中元素的个数。建堆的过程是线性的过程,从len/2到0处一直调用调整堆的过程,相当于o(h1)+o(h2)…+o(hlen/2) 其中h表示节点的深度,len/2表示节点的个数,这是一个求和的过程,结果是线性的O(n)。
②调整堆:调整堆在构建堆的过程中会用到,而且在堆排序过程中也会用到。利用的思想是比较节点i和它的孩子节点left(i),right(i),选出三者最大(或者最小)者,如果最大(小)值不是节点i而是它的一个孩子节点,那边交互节点i和该节点,然后再调用调整堆过程,这是一个递归的过程。调整堆的过程时间复杂度与堆的深度有关系,是lgn的操作,因为是沿着深度方向进行调整的。
③堆排序:堆排序是利用上面的两个过程来进行的。首先是根据元素构建堆。然后将堆的根节点取出(一般是与最后一个节点进行交换),将前面len-1个节点继续进行堆调整的过程,然后再将根节点取出,这样一直到所有节点都取出。堆排序过程的时间复杂度是O(nlgn)。因为建堆的时间复杂度是O(n)(调用一次);调整堆的时间复杂度是lgn,调用了n-1次,所以堆排序的时间复杂度是O(nlgn) - 注意
①只需做n-1趟排序,选出较大的n-1个关键字即可以使得文件递增有序。
②用小根堆排序与利用大根堆类似,只不过其排序结果是递减有序的。堆排序和直接选择排序相反:在任何时刻堆排序中无序区总是在有序区之前,且有序区是在原向量的尾部由后往前逐步扩大至整个向量为止
- 时间复杂度:O(N*logN)
- 由于建初始堆所需的比较次数较多,所以堆排序不适宜于记录数较少的文件。
- 空间复杂度:O(1)
- 稳定性:它是不稳定的排序方法。(排序的稳定性是指如果在排序的序列中,存在前后相同的两个元素的话,排序前 和排序后他们的相对位置不发生变化)
代码实现
- 我定义一个函数指针为了让用户输入Less(小堆)或者Great(大堆),即可实现其功能。
typedef int(*Pcompare)(int left, int right);
int Less(int left, int right)
{
return left < right;
}
int Great(int left, int right)
{
return left > right;
}
- 为了便于调试,我定义了一个打印数组元素的函数
void PrintArray(int* array,int size)
{
for (int i = 0; i < size; i++)
printf("%d ", array[i]);
printf("\n");
}
- 这时堆排序的主要思路:首先用向下调整法将数组元素在数组中建立起一个堆,建立大堆还是小堆由用户决定。假设建立的是大堆,那么堆的堆顶元素就是集合中最大的元素,接下来,将堆顶元素与堆中最后一个元素进行交换,将size-1,用剩下的size-1个元素继续建立堆,然后又将堆顶元素和第size-1个元素进行交换。依次类推,当走到size=1的时候,我们就得到了一个排好序的数组了
void AdjustDown(int* array, int size, int parent,Pcompare compare)
{
int child = (parent << 1) + 1;
while (child < size)
{
if (child + 1 < size && compare(array[child], array[child + 1]))
child += 1;
if (compare(array[parent] , array[child]))
{
Swap(&array[child], &array[parent]);
parent = child;
child = (parent << 1) + 1;
}
else
return;
}
}
void HeapSort(int* array, int size,Pcompare compare)
{
assert(array);
int root = ((size - 2) >> 1);
for (; root >= 0; root--)
AdjustDown(array, size, root, compare);
for (int j = 0; j < size - 1; j++)
{
Swap(&array[0], &array[size - 1 - j]);
AdjustDown(array, size - j - 1, 0, compare);
}
}
- 我的测试代码
void TestHeapSort()
{
int array[] = { 3, 5, 7, 2, 1, 4, 6 };
int size = sizeof(array) / sizeof(int);
PrintArray(array, size);
HeapSort(array, size, Less);
PrintArray(array, size);
}
最后附上我的所有代码
#pragma once
#include<assert.h>
#include<stdio.h>
#include<stdlib.h>
typedef int(*Pcompare)(int left, int right);
int Less(int left, int right)
{
return left < right;
}
int Great(int left, int right)
{
return left > right;
}
void Swap(int* a, int* b)
{
int temp = *a;
*a = *b;
*b = temp;
}
void AdjustDown(int* array, int size, int parent,Pcompare compare)
{
int child = (parent << 1) + 1;
while (child < size)
{
if (child + 1 < size && compare(array[child], array[child + 1]))
child += 1;
if (compare(array[parent] , array[child]))
{
Swap(&array[child], &array[parent]);
parent = child;
child = (parent << 1) + 1;
}
else
return;
}
}
void HeapSort(int* array, int size,Pcompare compare)
{
assert(array);
int root = ((size - 2) >> 1);
for (; root >= 0; root--)
AdjustDown(array, size, root, compare);
for (int j = 0; j < size - 1; j++)
{
Swap(&array[0], &array[size - 1 - j]);
AdjustDown(array, size - j - 1, 0, compare);
}
}
void PrintArray(int* array,int size)
{
for (int i = 0; i < size; i++)
printf("%d ", array[i]);
printf("\n");
}
void TestHeapSort()
{
int array[] = { 3, 5, 7, 2, 1, 4, 6 };
int size = sizeof(array) / sizeof(int);
PrintArray(array, size);
HeapSort(array, size, Less);
PrintArray(array, size);
}
以上是我对于堆排序的认识,如有问题,欢迎下方留言