算法-QuickSort及其复杂度分析

最新推荐文章于 2025-07-30 10:48:56 发布

原创最新推荐文章于 2025-07-30 10:48:56 发布 · 4.2k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #pivot #c

算法专栏收录该内容

4 篇文章

订阅专栏

本文详细介绍了快速排序算法的实现，包括其基本思想、partition函数的逻辑以及如何保持排序条件。讨论了算法在最好、最坏和平均情况下的时间复杂度，指出在最坏情况下复杂度为O(n^2)，最好和一般情况下为O(nlogn)。此外，通过随机选择枢轴元素可以改善分区的均匀性，从而提高平均性能。

快排的算法有很多种变型，比较常见的一种如下：
QucikSort( p,q)
Begin
if( p>q) return
r = partition(p,q)
QuickSort(p,r-1)
QuickSort(r+1,q)
End

其中partition函数定义如下：

Partition(p,q)
begin
tmp=A[q];
i = p-1;
for( j = p to q-1)
begin
    if( A[j]<=tmp) i++; swap(A[i],A[j]);
end
swap(A[i+1],A[q])
return i+1
end

在执行过程中，下面两个条件保持不变：
1.    i之前的元素（包括i）都小于等于A[q];
2.    i和j之间的元素(不包括i,j)都大于A[q]; J之外的元素（包括j）未知；
当for循环运行时，如果A[j]大于tmp，那么j+1，条件2得以维持；如果A[j]小于等于tmp，i增加，同时把 J 位置的元素替换掉原来的元素，条件1得以维持。
当循环结束时，交换q和第一个大于tmp的元素，返回i+1.

当然这个算法的结果是一个升序的排列，如果改成A[j]>=tmp时交换，便会得到降序的排列。

对这个算法的分析需要分成3中，最好，最坏，平均。
最坏情况下，每次partition的时候，都得到很不平衡的结果，一个是0，一个是n-1，那么复杂度可以表示为
T(n) = T(n-1)+c*n = c(n + n-1 +n-2+...+1)=c*n*n
最好情况呢，每个分区都很平均，那么T(n) = 2*T(n/2)+c*n，利用master的方法，属于第二种，因此是n*lg(n)。
一般的情况呢，不是很平均，但也不是绝对不均，举例来说1/10和9/10吧。那么算法的最长路径是以10/9为底的n的对数。每层花费n，故复杂度任然是 nlg(n)。
利用我们之前的随机算法，在进行partition之前，先将尾部的元素和数组中随机元素交换，可以确保获得平均的分区。
下面我们进行严格的平均复杂度分析。
首先我们请注意到，所有实际的排序操作都在partition中做完的，因为排序从根本上来讲还是元素的交换，那么在partition函数中进行了多少次比较就是整个算法复杂度的关键。
如果将A中的元素排列成S (z1,z2,…,zn)，zi表示第i小元素。在整个排序过程中，任意两个元素最多比较一次。如果我们定义一个变量Xij，当zi和zj发生比较时为1，否则为0。那么把对所有可ij求和Xij就得到全部的比较次数。我们对这个和求期望，根据期望的线性性，也就是zi和zj发生比较的概率的总和。
那么zi和zj发生比较的概率是多少呢？在Sij这个子集合里，只有zi或zj被选为pivot的时候他们才会有比较，而平均来讲，这个概率是2/(j-i+1)。这就是S中任意两个元素发生比较的概率。如果不在这个集合里呢？
因此所有比较次数的表达式是Sum(2/(j-i+1))， i从1到n-1，j从i+1到n。
他可以变形为n个Sum（2/k）k从1到n。
最终得到n*lg(n)。