排序
快速排序
快排的基本思想是分治。
时间复杂度为nlogn,是一种十分理想的排序方式,通过c++的stl可以直接使用sort来实现,但是快排的实现原理依旧值得研究,并且面试中也时常会遇到。
手写快排时常常会遇到边界问题,需要特别注意。
步骤:
- 每次在当前区间中选择一个基准数x,x可以为
q[l],q[r],q[l+r>>1]
- 选取两个指针分别从区间的左右端点开始,左指针i遇到第一个大于等于基准数的值就停下,右指针j遇到第一个小于等于基准数的值就停下,然后交换这两个值
- ij指针按照上部规则继续向前走,直到 i > = j i>=j i>=j停止循环
- 这样我们就实现了将一个待排序区间分成了左右两个区间,左区间全部满足小于等于基准数,右区间全部满足大于等于基准数,分治思想由此体现
- 接下来递归执行 [ l , j ] [l,j] [l,j] [ j + 1 , r ] [j+1,r] [j+1,r] 这两个区间,(当然也可以以i为分界点,但是可能会出现边界问题,用j更好一些)
void quick_sort(int q[],int l,int r){
if(l>=r) return;
int x=q[l+r>>1],i=l-1,j=r+1;
while(i<j){
do i++; while(q[i]<x);
do j--; while(q[j]>x);
if(i<j) swap(q[i],q[j]);
}
quick_sort(q,l,j);
quick_sort(q,j+1,r);
}
手模一下这组样例
8
4 2 1 6 8 7 5 2
栈溢出
对于基准数x的选取,(也坑了我好久)
我一开始用的是x=q[l]
,然后tle了,手模样例也没有发现问题,下载了数据点之后发现是因为有这种坑人的样例:
100000
1 2 3 4 5 6...99999 100000
导致它每次递归的时候,一直
[1,100000]
[2,100000]
[3,100000]
...
[32362,100000]
戛然而止
没错,由于递归深度一直不断加深,爆栈了。
但如果把基准数换成x=q[l+r>>1]
,递归的过程就变成了
[1,100000]
[1,48333]
[1,24167]
[1,12084]
[1,6042]
[1,3021]
[1,1511]
[1,756]
[1,378]
[1,189]
[1,95]
[1,48]
[1,24]
[1,12]
[1,6]
[1,3]
[1,2]
就不会爆栈啦。
归并排序
归并排序的基本思想也是分治。
步骤:
- 确定分界点 mid=l+r>>1
- 将分成的两个区间分别递归
- 双指针分别指向区间最小值,然后依次将该值放入暂存数组tmp[]中
- 将tmp中的数据覆盖到原数组中
void merge_sort(int q[],int l,int r){
if(r<=l) return ;
int mid=r+l>>1;
merge_sort(q,l,mid);
merge_sort(q,mid+1,r);
int k=0,i=l,j=mid+1;
while(i<=mid&&j<=r)
if(q[i]<q[j]) tmp[++k]=q[i++];
else tmp[++k]=q[j++];
while(i<=mid) tmp[++k]=q[i++];
while(j<=r) tmp[++k]=q[j++];
for(i=l,j=1;i<=r;i++,j++) q[i]=tmp[j];
}
再手模一下刚刚这组样例
时间复杂度
快排和归并的时间复杂度都是nlogn,n是排序的时间,logn是递归的层数。
但是快排时间复杂度在理想状况下是nlogn,只是它的一个平均值,因为快排递归层数不一定是logn;
而归并的时间复杂度在严格意义上是nlogn,因为归并在递归的时候一定是logn层。
稳定性
稳定排序是指原来相等的两个元素前后相对位置在排序后依然不变。
快排是不稳定的,归并是稳定的,在手模样例中不难发现。
其实稳定性这个东西在算法中没什么卵用,但是笔试的时候经常会考。
对比
快排和归并在算法实现上有一个显著的区别,一个是先操作再递归,一个是先递归再操作。