关于包含重复元素的快速排序

本文详细解析了快速排序中加入等号处理重复元素的技巧,对比传统不带等号的实现,强调了这种改进如何确保正确性,并通过实例证明其有效性。适合理解快速排序进阶细节的开发者。
力扣215:数组中的第K个最大元素
public int partition(int[] nums, int low, int high) {
        int pivot = nums[low];
        while (low < high) {
            while (pivot <= nums[high] && low < high)    high--;
            nums[low] = nums[high];
            while (pivot >= nums[low] && low < high)     low++;
            nums[high] = nums[low];
        }
        nums[low] = pivot;
        return low;
    }

    public void quicksort(int[] nums, int low, int high) {
        int pivot;
        if (low < high) {
            pivot = partition(nums, low, high);
            quicksort(nums, low, pivot - 1);
            quicksort(nums, pivot + 1, high);
        }
    }

一般我们写快排的时候都是如下写的:


       
      
            while (pivot < nums[high] && low < high) 
            while (pivot > nums[low] && low < high)  
    

也就是说不带“=”,这时的快速排序就会有重复元素覆盖掉未重复元素,从而导致错误。

而如果加入“=”,程序在运行这一行代码时,就会跳过重复元素,而不会中断while循环交换元素,自然不会出现错误。

具体证明可以:找一个含重复元素的数组在草稿纸上验证。

### 三路快速排序处理重复元素包含重复元素的数组中,标准快速排序的划分方式可能导致划分不均,使时间复杂度退化为 $ O(n^2) $,尤其在大量重复元素的情况下效率显著下降[^2]。为解决这一问题,三路快速排序(Dijkstra 三向切分)被引入,它将数组划分为三个部分:小于基准值的元素、等于基准值的元素和大于基准值的元素。这种方法能有效减少递归深度,提高排序效率。 以下是一个三路快速排序的 C++ 实现示例: ```cpp #include <iostream> #include <vector> using namespace std; // 三路快速排序的分区函数 void threeWayPartition(vector<int>& arr, int left, int right, int& lt, int& gt) { int pivot = arr[left]; // 选择最左边的元素作为基准 int i = left; while (i <= gt) { if (arr[i] < pivot) { swap(arr[i++], arr[lt++]); } else if (arr[i] > pivot) { swap(arr[i], arr[gt--]); } else { i++; } } } // 三路快速排序递归函数 void quickSortWithDuplicates(vector<int>& arr, int left, int right) { if (left >= right) { return; } int lt = left, gt = right; threeWayPartition(arr, left, right, lt, gt); quickSortWithDuplicates(arr, left, lt - 1); // 排序小于 pivot 的部分 quickSortWithDuplicates(arr, gt + 1, right); // 排序大于 pivot 的部分 } // 主函数测试 int main() { vector<int> arr = {3, 1, 4, 2, 2, 3, 1}; cout << "排序前: "; for (int num : arr) { cout << num << " "; } cout << endl; quickSortWithDuplicates(arr, 0, arr.size() - 1); cout << "排序后: "; for (int num : arr) { cout << num << " "; } cout << endl; return 0; } ``` ### 处理重复元素的优势 三路快速排序在处理大量重复元素时具有显著优势。通过将数组划分为小于、等于和大于基准值的三部分,等于基准值的部分在后续递归中不再参与排序,从而减少不必要的比较和交换操作。这种方式使得在处理包含大量重复值的数组时,排序效率接近 $ O(n \log n) $,避免了传统快速排序的性能退化问题[^2]。 ### 适用场景 三路快速排序特别适用于以下情况: - 数组中存在大量重复元素。 - 需要对大规模数据进行高效排序。 - 数据分布不均匀,重复值较多。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值