快速选择的平均时间复杂度

最新推荐文章于 2025-04-23 15:06:58 发布

原创最新推荐文章于 2025-04-23 15:06:58 发布 · 1.7k 阅读

9 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #快速排序

算法的数学原理专栏收录该内容

9 篇文章

订阅专栏

本文以快速排序算法思路，探讨在含N个元素无序列表中找第k小元素的平均时间复杂度。介绍快速选择方法，通过选择枢纽元分组递归查找。经推导得出快速选择的平均时间复杂度为O(N)。

快速选择的平均时间复杂度

以快速排序算法的思路，在含有N个元素的无序列表中找到第k小元素的平均时间复杂度

快速选择

选择枢纽元，将原无序列表分为两组：小于枢纽元的在 $S_1$ 组；大于枢纽元的在 $S_2$ 组（假设无序列表中不存在重复元素）。令 $S_1|$ 为 $S_1$ 中元素个数

当 $k<|S_1|$ 时，第k小元素位于 $S_1$ 组中，对 $S_1$ 组递归执行快速选择
若 $k=|S_1|+1$ ，此时第k小元素即是枢纽元，找到目标值
若 $k>|S_1|+1$ ，第k小元素位于 $S_2$ 组中，对 $S_2$ 组递归执行快速选择

时间复杂度

$k∈[1,N]k\in[1,N]$ ，且k为任意值的平均时间复杂度都是相等的，因此我们可以将问题转化为：以快速排序算法的思路，在含有N个元素的无序列表中找到第N小元素的平均时间复杂度

令T(N)为找到第N小元素的平均时间复杂度，为简化计算我们假设枢纽元的选择是在所有元素中随机等概率选取的，由此我们可以知道

有1/N的概率，选取到的枢纽元即是第N小元素，此时找到目标值
有(N-1)/N的概率，选取到的枢纽元不是第N小元素，设选取到的枢纽元为第i小元素，此时需要将 $N - i$ 个大于枢纽元的元素递归执行快速选择。其中i是等概率的从[1,N-1]中选取的，因此需要将i所有取值的时间复杂度的均值作为平均时间复杂度

以上两种可能的任意一种都需要在选取枢纽元后对无序列表的N个元素进行分组，即需要执行N次操作

由此我们可得T(N)的递归表达式
$T(N)=\left\{\begin{array}{ll} N, & 1/N的概率 \\ 1/(N-1)\sum_{i=1}^{N-1} T(N-i) + N, & (N-1)/N的概率 \end{array}\right. \tag 1$
我们不妨使用T(N)的期望值E(N)来替代T(N)以简化运算
$\begin{array}{ll} E(N) & = N/N + (N-1)/N \times1/(N-1)\sum_{i=1}^{N-1}E(N-i) + N-1 \\ & = 1/N\sum_{i=1}^{N-1}E(N-i) + N \\ \therefore T(N) & = 1/N\sum_{i=1}^{N-1}T(N-i) + N \\ NT(N) & = \sum_{i=1}^{N-1}T(N-i) + N^2 \end{array} \tag2$
当无序列表元素总数为 $N - 1$ 时，套用（2）可得
$\begin{array}{ll} (N-1)T(N-1) & = \sum_{i=1}^{N-2}T(N-1-i) + (N-1)^2 \end{array} \tag3$
$(2) - (3)$ 可得
$\begin{array}{ll} NT(N) - (N-1)T(N-1) & = T(N-1) + 2N - 1 \\ NT(N) & = NT(N-1) + 2N - 1 \\ T(N) & = T(N-1) + 2 - 1/N \end{array} \tag4$
对（4）使用叠缩可得
$\begin{array}{ll} T(N) & = T(N-1) + 2 - 1/N \\ T(N-1) & = T(N-2) + 2 - 1/(N-1) \\ T(N-2) & = T(N-3) + 2 - 1/(N-2) \\ ... \\ T(2) & = T(1) + 2 - 1/2 \end{array} \tag5$
（5）各项相加可得
$\begin{array}{ll} T(N) & = T(1) + 2(N-1) + 1 - \sum_{i=1}^N 1/i \end{array} \tag6$
其中 $1,\ \sum_{i=1}^N 1/i$ 是调和级数， $∑i=1N1/i≈lnN+γ\sum_{i=1}^N 1/i \approx lnN+\gamma$
$\begin{array}{ll} \therefore T(N) & = 2N - lnN - \gamma \\ T(N) &= O(N) \end{array} \tag7$
因此快速选择的平均时间复杂度为O(N)