含义
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。可以利用数组的特点快速定位指定索引的元素。堆分为大根堆和小根堆,是完全二叉树。大根堆的要求是每个节点的值都不大于其父节点的值,即A[PARENT[i]] >= A[i]。在数组的非降序排序中,需要使用的就是大根堆,因为根据大根堆的要求可知,最大的值一定在堆顶。
算法描述
堆排序利用了大根堆(或小根堆)堆顶记录的关键字最大(或最小)这一特征,使得在当前无序区中选取最大(或最小)关键字的记录变得简单。
(1)用大根堆排序的基本思想
① 先将初始文件R[1..n]建成一个大根堆,此堆为初始的无序区
② 再将关键字最大的记录R[1](即堆顶)和无序区的最后一个记录R[n]交换,由此得到新的无序区R[1..n-1]和有序区R[n],且满足R[1..n-1].keys≤R[n].key
③由于交换后新的根R[1]可能违反堆性质,故应将当前无序区R[1..n-1]调整为堆。然后再次将R[1..n-1]中关键字最大的记录R[1]和该区间的最后一个记录R[n-1]交换,由此得到新的无序区R[1..n-2]和有序区R[n-1..n],且仍满足关系R[1..n-2].keys≤R[n-1..n].keys,同样要将R[1..n-2]调整为堆。
……
直到无序区只有一个元素为止。
(2)大根堆排序算法的基本操作:
①建堆,建堆是不断调整堆的过程,从len/2处开始调整,一直到第一个节点,此处len是堆中元素的个数。建堆的过程是线性的过程,从len/2到0处一直调用调整堆的过程,相当于o(h1)+o(h2)…+o(hlen/2) 其中h表示节点的深度,len/2表示节点的个数,这是一个求和的过程,结果是线性的O(n)。
②调整堆:调整堆在构建堆的过程中会用到,而且在堆排序过程中也会用到。利用的思想是比较节点i和它的孩子节点left(i),right(i),选出三者最大(或者最小)者,如果最大(小)值不是节点i而是它的一个孩子节点,那边交互节点i和该节点,然后再调用调整堆过程,这是一个递归的过程。调整堆的过程时间复杂度与堆的深度有关系,是lgn的操作,因为是沿着深度方向进行调整的。
③堆排序:堆排序是利用上面的两个过程来进行的。首先是根据元素构建堆。然后将堆的根节点取出(一般是与最后一个节点进行交换),将前面len-1个节点继续进行堆调整的过程,然后再将根节点取出,这样一直到所有节点都取出。堆排序过程的时间复杂度是O(nlgn)。因为建堆的时间复杂度是O(n)(调用一次);调整堆的时间复杂度是lgn,调用了n-1次,所以堆排序的时间复杂度是O(nlgn)[2]
以上资料来自百度百科之堆排序
代码实现(Java)
/**
* 堆排序入口
*
* @param arr
* 待排序的数组
* @return
*/
public int[] heapSort(int[] arr) {
// 检查待排序数组是否合法,不合法就原数组返回
if (arr == null || arr.length <= 1)
return arr;
// 下面需要构建一个最大堆,最大推从最后一个父节点开始
int startIndex = getParentIndex(arr.length-1 );
// 从尾部创建最大推,每一次循环都得到最大堆
for (int i = startIndex; i >= 0; i--) {
buildMaxHeap(arr, arr.length, i);
}
// 执行排序任务
process(arr);
return arr;
}
/**
* 构建最大推
*
* @param arr
* 待建堆的数组
* @param heapSize
* 堆大小
* @param index
* 当前需要创建最大堆位置
*/
private void buildMaxHeap(int[] arr, int heapSize, int index) {
// 获取当前需要创建最大堆位置位置的左孩子
int left = getLeftChild(index);
// 获取当前需要创建最大堆位置位置的右孩子
int right = getRightChild(index);
int maxIndex = index;
if (left < heapSize && arr[left] > arr[maxIndex]) {
maxIndex = left;
}
if (right < heapSize && arr[right] > arr[maxIndex]) {
maxIndex = right;
}
// 得到最大值后可能需要交换,如果交换了,其子节点可能就不是最大堆了,需要重新调整
if (maxIndex != index) {
swap(arr, maxIndex, index);
buildMaxHeap(arr, heapSize, maxIndex);
}
}
/**
* 排序,最大值放在末尾,data虽然是最大堆,在排序后就成了递增的
*
* @param arr
* 待排序数组
*/
private void process(int[] arr) {
// 末尾与头交换,交换后调整最大堆
for (int i = arr.length - 1; i >= 0; i--) {
swap(arr, 0, i);
buildMaxHeap(arr, i, 0);
}
}
/**
* 交换数据函数
*
* @param arr
* 数据
* @param first
* 需要交换数组的下标
* @param second
* 需要交换数组的下标
*/
private void swap(int[] arr, int first, int second) {
int temp = arr[first];
arr[first] = arr[second];
arr[second] = temp;
}
/**
* 得到当前节点的父亲节点
*
* @param current
* @return
*/
private int getParentIndex(int current) {
return (current - 1) >> 1;
}
/**
* 得到当前节点的左孩子
*
* @param current
* @return
*/
private int getLeftChild(int current) {
return (current << 1) + 1;
}
/**
* 得到当前节点的有孩子
*
* @param current
* @return
*/
private int getRightChild(int current) {
return (current << 1) + 2;
}