归并排序
归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。
需求:
排序前:{8,4,5,7,1,3,6,2}
排序后:{1,2,3,4,5,6,7,8}
排序原理:
1.尽可能的一组数据拆分成两个元素相等的子组,并对每一个子组继续拆分,直到拆分后的每个子组的元素个数是1为止。
2.将相邻的两个子组进行合并成一个有序的大组;
3.不断的重复步骤2,直到最终只有一个组为止。
归并排序API设计:
类名 | Merge |
---|---|
构造方法 | Merge():创建Merge对象 |
成员方法 | 1.public static void sort(Comparable[] a):对数组内的元素进行排序 2.private static void sort(Comparable[] a, int lo, int hi):对数组a中从索引lo到索引hi之间的元素进行排序 3.private static void merge(Comparable[] a, int lo, int mid, int hi):从索引lo到所以mid为一个子组,从索引mid+1到索引hi为另一个子组,把数组a中的这两个子组的数据合并成一个有序的大组(从索引lo到索引hi) 4.private static boolean less(Comparable v,Comparable w):判断v是否小于w 5.private static void exch(Comparable[] a,int i,int j):交换a数组中,索引i和索引j处的值 |
成员属性 | 1.private static Comparable[] assist:完成归并操作需要的辅助数组 |
归并原理:
归并排序代码实现:
/**
* 归并排序
*/
public class Merge {
// 归并需要的辅助数组
private static Comparable[] assist;
// 对数组a中的元素进行排序
public static void sort(Comparable[] a) {
// 1.初始化辅助数组assist
assist = new Comparable[a.length];
// 2.定义一个lo变量,和hi变量,分别记录数组中最小的索引,和最大的索引
int lo = 0;
int hi = a.length - 1;
// 3.调用sort重载方法,完成数组a,从索引lo到索引hi的元素的排序
sort(a, lo, hi);
}
// 对数组a中从lo到hi的元素进行排序
private static void sort(Comparable[] a, int lo, int hi) {
// 安全性校验
if (lo >= hi) {
return;
}
// 分:对lo到hi之间的数据进行分组,分为两组(尽可能分为两个数组)
int mid = lo + (hi - lo) / 2;
// 治:分别对每一组数据进行排序
sort(a, lo, mid);
sort(a, mid + 1, hi);
// 再把排序后的两组数据进行归并
merge(a, lo, mid, hi);
}
// 对数组a中,从lo到mid为一组,从mid+1到hi为一组,对这两组数据进行归并
private static void merge(Comparable[] a, int lo, int mid, int hi) {
// lo到mid这组数据,和mid+1到hi这组数据,归并到辅助数组assist对应的索引处
// 1.定义三个指针
int i = lo; // 定义一个指针i,指向assist辅助数组的lo索引所的位置处
int p1 = lo; // 定义一个指针p1,指向a数组lo到hi中左子组的起始位置
int p2 = mid + 1; // 定义一个指针p2,指向数组a中lo到hi中右子组的起始位置
// 2.遍历这两个子组,移动指针p1与p2,比较对应索引位置的值,放到辅助数组assist对应的位置
while (p1 <= mid && p2 <= hi) {
if (less(a[p1], a[p2])) { // a[p1]<a[p2]
assist[i++] = a[p1++];
} else { // a[p1]>a[p2]
assist[i++] = a[p2++];
}
}
// 3.将这两个子组中,剩余的元素,放入辅助数组assist对应的位置上
// 3.1剩余的若是左子组
while (p1 <= mid) {
assist[i++] = a[p1++];
}
// 3.2剩余的若是右子组
while (p2 <= hi) {
assist[i++] = a[p2++];
}
// 4.将辅助数组assist中lo到hi排好序的元素,拷贝到a数组中
for (int index = lo; index <= hi; index++) {
a[index] = assist[index];
}
}
// 判断v是否小于w
private static boolean less(Comparable v, Comparable w) {
return v.compareTo(w) < 0;
}
// 交换a数组中,索引i和索引j处的值
private static void exchange(Comparable[] a, int i, int j) {
Comparable temp = a[i];
a[i] = a[j];
a[j] = temp;
}
}
归并排序时间复杂度分析:
归并排序是分治思想的最典型的例子,上面的算法中,对a[lo…hi]进行排序,先将它分为a[lo…mid]和a[mid+1…hi]两部分,分别通过递归调用将他们单独排序,最后将有序的子数组归并为最终的排序结果。该递归的出口在于如果一个数组不能再被分为两个子数组,那么就会执行merge进行归并,在归并的时候判断元素的大小进行排序。
用树状图来描述归并,如果一个数组有8个元素,那么它将每次除以2找最小的子数组,共拆log8次,值为3,所以树共有3层,那么自顶向下第k层有2k个子数组,每个数组的长度为2(3-k),归并最多需要2^(3-k)次比较。因此每层的比较次数为 2^k * 2(3-k)=23,那么3层总共为 3x23。假设元素的个数为n,那么使用归并排序拆分的次数为log2(n),所以共log2(n)层,那么使用log2(n)替换上面3x23中 的3这个层数,最终得出的归并排序的时间复杂度为:log2(n)* 2^(log2(n))=log2(n)*n,根据大O推导法则,忽略底数,最终归并排序的时间复杂度为O(nlogn);
归并排序的缺点:
需要申请额外的数组空间,导致空间复杂度提升,是典型的以空间换时间的操作。
希尔排序和归并排序在处理大批量数据时差别不是很大。