第二章总结-优快云博客

本文链接：https://blog.youkuaiyun.com/2301_79198789/article/details/143099738

寻找第 k 小的数的分治算法通常使用类似于快速排序的策略。以下是该算法的自然语言描述和伪代码，以及时间复杂度的分析。

算法描述

选择一个基准：从数组中随机选择一个基准元素（pivot）。
分区：将数组划分为三个部分：
- 小于基准元素的部分
- 等于基准元素的部分
- 大于基准元素的部分
判断基准的位置：
- 如果基准元素的位置正好是 kk（也就是我们要找的元素），则返回该基准元素。
- 如果基准元素的位置大于 kk，则在小于基准的部分递归查找第 kk 小的元素。
- 如果基准元素的位置小于 kk，则在大于基准的部分递归查找第 k−pivot_index−1k−pivot_index−1 小的元素（因为我们已经跳过了小于基准的部分和基准元素）。

function findKthSmallest(array, k):
    if length(array) == 1:
        return array[0]  // 只有一个元素时返回该元素

    pivot = random choice from array
    less = []
    equal = []
    greater = []

    for each element in array:
        if element < pivot:
            less.append(element)
        else if element == pivot:
            equal.append(element)
        else:
            greater.append(element)

    pivotIndex = length(less)  // 基准元素在排序后的索引

    if k < pivotIndex:
        return findKthSmallest(less, k)  // 在小于基准的部分递归
    else if k >= pivotIndex + length(equal):
        return findKthSmallest(greater, k - pivotIndex - length(equal))  // 在大于基准的部分递归
    else:
        return pivot  // 基准元素就是我们要找的第 k 小的元素

时间复杂度分析

最好情况：
- 在每次划分时，基准元素恰好将数组分成相等的两部分。在这种情况下，递归的深度是 O(log⁡n)O(logn)，每次划分都需要 O(n)O(n) 的时间。因此，最好情况下的时间复杂度是：
O(nlog⁡n)O(nlogn)
最坏情况：
- 如果每次划分都是极端不平衡的（例如，总是选取数组的最大或最小元素作为基准），则会导致每次只减少一个元素，形成一个类似链表的结构。此时，递归的深度为 O(n)O(n)，每次仍需 O(n)O(n) 的时间，因此最坏情况下的时间复杂度是：
O(n2)O(n2)
平均情况：
- 由于随机选择基准元素的策略，在大多数情况下，划分会相对均衡。因此，平均情况下的时间复杂度为：
O(n)O(n)