1、n个关键字序列Kl,K2,…,Kn称为堆。
堆性质:
ki<=k(2i)且ki<=k(2i+1)(1≤i≤ n),这是小根堆,大根堆则换成>=号。
//k(i)相当于二叉树的非叶子结点,K(2i)则是左子节点,k(2i+1)是右子节点。
2、若将此序列所存储的向量R[1..n]看做是一棵完全二叉树的存储结构,则堆实质上是满足如下性质的完全二叉树:
树中任一非叶子结点的关键字均不大于(或不小于)其左右孩子(若存在)结点的关键字。
3、例如:
关键字序列(10,15,56,25,30,70)和(70,56,30,25,15,10)分别满足堆性质1和2,故它们均是堆。
大根堆和小根堆:
根结点(亦称为堆顶)的关键字是堆里所有结点关键字中最小者的堆称为小根堆,又称最小堆。根结点(亦称为堆顶)的关键字是堆里所有结点关键字中最大者,称为大根堆,又称最大堆。
4、高度
堆可以被看成是一棵树,结点在堆中的高度可以被定义为从本结点到叶子结点的最长简单下降路径上边的数目;定义堆的高度为树根的高度。我们将看到,堆结构上的一些基本操作的运行时间至多是与树的高度成正比,为O(lgn)。
5、用大根堆排序的基本思想
① 先将初始文件R[1..n]建成一个大根堆,此堆为初始的无序区。
② 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换,由此得到新的无序区R[1..n-1]和有序区R[n],且满足R[1..n-1].keys≤R[n].key。
③由于交换后新的根R[1]可能违反堆性质,故应将当前无序区R[1..n-1]调整为堆。然后再次将R[1..n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换,由此得到新的无序区R[1..n-2]和有序区R[n-1..n],且仍满足关系R[1..n-2].keys≤R[n-1..n].keys,同样要将R[1..n-2]调整为堆。
……
直到无序区只有一个元素为止。
6、大根堆排序算法的基本操作:
① 初始化操作:将R[1..n]构造为初始堆;
② 每一趟排序的基本操作:将当前无序区的堆顶记录R[1]和该区间的最后一个记录交换,然后将新的无序区调整为堆(亦称重建堆)。
注意:
①只需做n-1趟排序,选出较大的n-1个关键字即可以使得文件递增有序。
②用小根堆排序与利用大根堆类似,只不过其排序结果是递减有序的。堆排序和直接选择排序相反:在任何时刻堆排序中无序区总是在有序区之前,且有序区是在原向量的尾部由后往前逐步扩大至整个向量为止
7、特点
在排序过程中,将R[l..n]看成是一棵完全二叉树的顺序存储结构,利用完全二叉树中双亲结点和孩子结点之间的内在关系(参见二叉树的顺序存储结构),在当前无序区中选择关键字最大(或最小)的记录。
8、区别
直接选择排序中,为了从R[1..n]中选出关键字最小的记录,必须进行n-1次比较,然后在R[2..n]中选出关键字最小的记录,又需要做n-2次比较。
事实上,后面的n-2次比较中,有许多比较可能在前面的n-1次比较中已经做过,但由于前一趟排序时未保留这些比较结果,所以后一趟排序时又重复执行了这些比较操作。
堆排序可通过树形结构保存部分比较结果,可减少比较次数。
9、C++代码实现:
void HeapAdjust(int array[] , int s , int m) // 对堆进行调整,使下标从s到m的无序序列成为一个大顶堆
{
int j , temp = array[s];
for(j = 2*s; j <= m ; j *= 2)
{
if(j < m && array[j] < array[j + 1]) // 如果结点的左孩子小于右孩子增加j的值
++j; // 用于记录较大的结点的下标
if(temp >= array[j]) // 如果父结点大于等于两个孩子,则满足大顶堆的定义,跳出循环
break;
array[s] = array[j]; // 否则用较大的结点替换父结点
s = j; // 记录下替换父结点的结点下标
}
array[s] = temp; // 把原来的父结点移动到替换父结点的结点位置
}
void HeapSort(int array[] , int len)
{
int i;
for(i = len / 2; i >= 0 ; --i) // 建立大顶堆
HeapAdjust(array , i , len-1);
for(i = len - 1 ; i > 0 ; --i)
{
swap(array[0] , array[i] ); // 第个元素和最后一个元素进行交换
HeapAdjust(array , 0 , i-1); // 建立大顶堆
}
}