堆是具有下列性质的完全二叉树:每个节点的值都大于或等于其左右孩子节点的值,称为大顶堆;或每个节点的值都小于或等于其左右孩子节点的值,称为小顶堆。
堆排序(Heap Sort)
就是利用堆(假设利用大顶堆)进行排序的方法。它的基本思想是,将待排序的序列构造成一个大顶堆。此时,整个序列的最大值就是堆顶的根节点。将它移走(其实就是将其与堆数组末尾元素交换,此时末尾元素就是最大值),然后将剩余的 n-1 个序列重新构造成一个堆,这样就会得到 n 个元素中的 次大值。如此哦反复执行,便能得到一个有序序列了。
java实现:
public static void HeapAdjust(int[] arr, int s, int m) //构建大顶堆
{
int temp, j;
temp = arr[s];
for(j = 2*s; j < m; j *= 2) /*沿关键字较大的孩子节点向下筛选*/
{
if(j < m && arr[j] < arr[j+1])
++j; /*j为关键字中较大的记录下标*/
if(temp >= arr[j])
break; /*如果temp(也就是根节点)大于左右孩子的最大值,就不用交换,退出循环*/
arr[s] = arr[j];
s = j;
}
arr[s] = temp;
}
public static void Heap_Sort(int[] arr)
{
int i;
for(i = arr.length/2; i >= 0; i--) //将arr构建成大顶堆
{
HeapAdjust(arr, i, arr.length-1);
}
for(i = arr.length-1; i >= 0; i--) //每次循环取出大顶堆的根节点【也就是最大元素】,将第一个元素与最后一个交换
{ //将剩下的i-1个元素继续构建成大顶堆
int temp = arr[0];
arr[0] = arr[i];
arr[i] = temp;
HeapAdjust(arr, 0, i-1);
}
}
堆排序的运行时间主要是消耗在 初始化构建堆 和 重建堆 时反复筛选上。
堆排序的时间复杂度为O(nlogn)。由于堆排序堆原始记录的排序状态并不敏感,因此它无论是最好,最坏和平均时间复杂度
均为O(nlogn)。在这性能上显然要远远好过于 冒泡,简单选择,直接插入的 O(n²)的时间复杂度了。
空间复杂度上,它只有一个用来交换的暂存单元,也非常不错。不过由于记录的比较与交换是跳跃式进行的,因此堆排序也是一种不稳定的排序方法。由于初始构建堆所需的比较次数比较多,因此,它并不适合待排序序列个数较少的情况。