快排的算法有很多种变型,比较常见的一种如下:
QucikSort( p,q)
Begin
if( p>q) return
r = partition(p,q)
QuickSort(p,r-1)
QuickSort(r+1,q)
End
其中partition函数定义如下:
Partition(p,q)
begin
tmp=A[q];
i = p-1;
for( j = p to q-1)
begin
if( A[j]<=tmp) i++; swap(A[i],A[j]);
end
swap(A[i+1],A[q])
return i+1
end
在执行过程中,下面两个条件保持不变:
1. i之前的元素(包括i)都小于等于A[q];
2. i和j之间的元素(不包括i,j)都大于A[q]; J之外的元素(包括j) 未知;
当for循环运行时,如果A[j]大于tmp,那么j+1,条件2得以维持;如果A[j]小于等于tmp,i增加,同时把 J 位置的元素替换掉原来的元素,条件1得以维持。
当循环结束时,交换q和第一个大于tmp的元素,返回i+1.
当然这个算法的结果是一个升序的排列,如果改成A[j]>=tmp时交换,便会得到降序的排列。
对这个算法的分析需要分成3中,最好,最坏,平均。
最坏情况下,每次partition的时候,都得到很不平衡的结果,一个是0,一个是n-1,那么复杂度可以表示为
T(n) = T(n-1)+c*n = c(n + n-1 +n-2+...+1)=c*n*n
最好情况呢, 每个分区都很平均,那么T(n) = 2*T(n/2)+c*n,利用master的方法,属于第二种,因此是n*lg(n)。
一般的情况呢,不是很平均,但也不是绝对不均,举例来说1/10和9/10吧。那么算法的最长路径是 以10/9为底的n的对数。每层花费n,故复杂度任然是 nlg(n)。
利用我们之前的随机算法,在进行partition之前,先将尾部的元素和数组中随机元素交换,可以确保获得平均的分区。
下面我们进行严格的平均复杂度分析。
首先我们请注意到,所有实际的排序操作都在partition中做完的,因为排序从根本上来讲还是元素的交换,那么在partition函数中进行了多少次比较就是整个算法复杂度的关键。
如果将A中的元素排列成S (z1,z2,…,zn),zi表示第i小元素。在整个排序过程中,任意两个元素最多比较一次。如果我们定义一个变量Xij,当zi和zj发生比较时为1,否则为0。那么把对所有可ij求和Xij就得到全部的比较次数。我们对这个和求期望,根据期望的线性性,也就是zi和zj发生比较的概率的总和。
那么zi和zj发生比较的概率是多少呢?在Sij这个子集合里,只有zi或zj被选为pivot的时候他们才会有比较,而平均来讲,这个概率是2/(j-i+1)。这就是S中任意两个元素发生比较的概率。如果不在这个集合里呢?
因此所有比较次数的表达式是Sum(2/(j-i+1)), i从1到n-1,j从i+1到n。
他可以变形为n个Sum(2/k)k从1到n。
最终得到n*lg(n)。
算法-QuickSort及其复杂度分析
最新推荐文章于 2025-07-30 10:48:56 发布
本文详细介绍了快速排序算法的实现,包括其基本思想、partition函数的逻辑以及如何保持排序条件。讨论了算法在最好、最坏和平均情况下的时间复杂度,指出在最坏情况下复杂度为O(n^2),最好和一般情况下为O(nlogn)。此外,通过随机选择枢轴元素可以改善分区的均匀性,从而提高平均性能。
1964

被折叠的 条评论
为什么被折叠?



