面试必问：手撕快速排序的3种优化方案

原创于 2025-02-23 20:37:51 发布 · 518 阅读

CC 4.0 BY-SA版权

文章标签：

快速排序（Quick Sort） 是面试中最常被要求手写的算法之一，但写出基础版本只是第一步。如何在面试中展现你对性能优化的深入理解？本文将详解快速排序的 3种核心优化方案，附可直接复用的代码模板和性能对比，助你在算法面试中脱颖而出！

1.1 核心思想

快速排序采用 分治思想，通过一趟排序将数据分割为独立的两部分：

def quick_sort_basic(arr, low, high):
    if low < high:
        # 分区操作，返回基准值正确位置索引
        pivot_idx = partition(arr, low, high)
        # 递归排序左子数组和右子数组
        quick_sort_basic(arr, low, pivot_idx - 1)
        quick_sort_basic(arr, pivot_idx + 1, high)
        
def partition(arr, low, high):
    pivot = arr[high]  # 选最后一个元素为基准
    i = low - 1        # 小于基准的边界指针
    for j in range(low, high):
        if arr[j] <= pivot:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[i+1], arr[high] = arr[high], arr[i+1]
    return i + 1

1.2 基础版本的缺陷

最坏时间复杂度：当数组已有序时，退化为O(n²)
递归深度：极端情况下栈溢出风险
元素重复：大量重复元素导致分区不平衡

二、优化方案一：三数取中法（Median-of-Three）

2.1 解决什么问题？

避免选取 最大/最小值 作为基准导致分区极度不平衡。

2.2 实现步骤

在 low, mid, high 三个位置取中位数
将中位数交换到 high 位置作为基准

def median_of_three(arr, low, high):
    mid = (low + high) // 2
    # 找出三个元素的中位数
    if arr[low] > arr[mid]:
        arr[low], arr[mid] = arr[mid], arr[low]
    if arr[low] > arr[high]:
        arr[low], arr[high] = arr[high], arr[low]
    if arr[mid] > arr[high]:
        arr[mid], arr[high] = arr[high], arr[mid]
    # 将中位数放到high位置
    arr[mid], arr[high] = arr[high], arr[mid]

def partition_optimized1(arr, low, high):
    median_of_three(arr, low, high)  # 关键修改！
    pivot = arr[high]
    i = low - 1
    for j in range(low, high):
        if arr[j] <= pivot:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[i+1], arr[high] = arr[high], arr[i+1]
    return i + 1

2.3 性能提升

将最坏情况概率降低至 <5%
时间复杂度稳定在 O(n log n)

三、优化方案二：小区间插入排序

3.1 为什么需要？

当子数组长度较小时，递归开销 > 排序开销。

3.2 实现方法

设置阈值（通常为10~20）
子数组长度小于阈值时，改用插入排序

INSERTION_THRESHOLD = 15

def quick_sort_optimized2(arr, low, high):
    if high - low < INSERTION_THRESHOLD:
        insertion_sort(arr, low, high)  # 小数组改用插入排序
    else:
        pivot_idx = partition_optimized1(arr, low, high)
        quick_sort_optimized2(arr, low, pivot_idx - 1)
        quick_sort_optimized2(arr, pivot_idx + 1, high)

def insertion_sort(arr, low, high):
    for i in range(low + 1, high + 1):
        key = arr[i]
        j = i - 1
        while j >= low and arr[j] > key:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key

3.3 性能对比

减少 20%~30% 的递归调用
整体速度提升约 15%

四、优化方案三：双路快排（应对重复元素）

4.1 重复元素的陷阱

当元素大量重复时，传统快排会导致 分区严重倾斜。

4.2 双指针分区法

使用 左右双指针 向中间扫描
保证重复元素均匀分布

def partition_optimized3(arr, low, high):
    median_of_three(arr, low, high)
    pivot = arr[high]
    left, right = low, high - 1
    while True:
        while left <= right and arr[left] < pivot:
            left += 1
        while left <= right and arr[right] > pivot:
            right -= 1
        if left > right:
            break
        arr[left], arr[right] = arr[right], arr[left]
        left += 1
        right -= 1
    arr[left], arr[high] = arr[high], arr[left]
    return left

4.3 适用场景

数据中有 超过30%的重复元素
时间复杂度从O(n²)降为 O(n)

五、终极优化：综合方案

将上述优化结合，并加入 尾递归优化 减少栈深度：

def quick_sort_final(arr, low, high):
    while low < high:  # 尾递归优化
        if high - low < INSERTION_THRESHOLD:
            insertion_sort(arr, low, high)
            break
        pivot_idx = partition_optimized3(arr, low, high)
        # 优先处理较短子数组
        if pivot_idx - low < high - pivot_idx:
            quick_sort_final(arr, low, pivot_idx - 1)
            low = pivot_idx + 1
        else:
            quick_sort_final(arr, pivot_idx + 1, high)
            high = pivot_idx - 1