三路划分


问题:对一个只可能含有1、2、3三种值的数组,按升序排序。

另一种常见问法:有一个只可能含有红、绿、蓝三种颜色的序列,进行分类,使红色都位于最左边,蓝色都位于最右边。


解法I:使用计数排序,比较直观,不再说。


解法II:进行两次快排中的二路划分:

想将数组划分为1和非1两个区间,再将非1段划分为2和3两区间 。


解法III:仿照快排中用到的二路划分,进行三路划分。

设原数组为A, 有n个元素。

使用三个指针left, middle, right, 那么

A[0]...A[left-1]的值都为1

A[left]...A[middle-1]的值都为2

A[right+1]...A[n-1]的值都为3.

A[middle]...A[right]的值不确定,还未划分。




核心步骤:

1)判断A[right]是否为3,若是:right左移,继续查找;若不是,A[right]与A[middle]交换,转到2)。

2)判断A[middle]的值,若为1:与A[left]交换, left右移,middle右移;若为2:middle右移。

3)重复1)~2)直到middle > right

时间复杂度O(n),空间复杂度O(1)。


代码:

#include <vector>
#include <iostream>
using namespace std;

void SortTriSegment(vector<int> &v){
	int left = 0, middle = 0, right = (int)v.size() - 1;
	while(middle <= right){
		while(middle <= right && v[right] == 3)  --right;
		if(middle > right) break;
		swap(v[right], v[middle]);
		if(v[middle] == 1){
			swap(v[left], v[middle]);
			++left;
		}
		++middle;
	}
}

int main(){
	int arr[] = {3, 1, 2};
	vector<int> v(begin(arr), end(arr));
	SortTriSegment(v);
	for(auto p : v)
		cout << p <<" ";
	cout << endl;
	return 0;
}

问题扩展:

扩展1:如果是更多路划分呢?此算法是否仍适用?

扩展2:如果要求是稳定划分呢(即稳定排序)?


<think>嗯,用户想了解快速排序中的三路划分,我得先回忆一下相关的知识点。首先,快速排序本身是基于分治法的,传统的实现是选取一个基准元素,然后把数组分成两部分,一部分比基准小,另一部分比基准大。不过当数组中有很多重复元素时,这种两路划分的效率可能会下降,因为重复元素会被反复处理。 那三路划分应该就是解决这个问题的。对了,三路划分会把数组分成三个部分:小于基准、等于基准和大于基准的部分。这样的话,在递归处理时,只需要处理小于和大于的部分,等于基准的部分就不用再处理了,尤其是在有大量重复元素时,可以显著提高效率。 需要解释清楚三路划分的基本思想,可能还要对比传统的双路划分。然后,步骤分解应该包括如何选择基准,如何分区,以及递归处理。可能还需要提到具体实现时的指针移动,比如使用lt、gt和i这样的指针,或者类似的变量来控制分区过程。 还有,最好举一个例子,比如一个包含多个重复元素的数组,展示三路划分后的结果。这样用户能更直观地理解。另外,时间复杂度的分析也很重要,最好说明在重复元素多的情况下,三路划分如何将复杂度从O(n log n)优化到接近O(n),或者避免最坏情况的发生。 可能还需要提到三路划分的应用场景,比如处理包含大量重复元素的数据集时,或者作为快速排序的优化手段之一。同时,注意语言要通俗易懂,避免过于专业的术语,但又要准确。最后,总结一下它的优缺点,或者和双路划分的对比,帮助用户全面理解。</think>### 快速排序中的三路划分 #### 1. **基本思想** 快速排序的**三路划分**(Three-way Partitioning)是一种优化策略,用于处理数组中存在**大量重复元素**的情况。它将数组划分为三个区域: - **小于基准值**的部分(左段) - **等于基准值**的部分(中段) - **大于基准值**的部分(右段) 通过将重复元素集中到中间段,后续递归时**只需处理左右两段**,避免对重复元素重复操作,从而提升效率。 --- #### 2. **具体步骤** 假设数组为 $$arr$$,基准值为 $$pivot$$,三路划分流程如下: 1. **初始化指针**: - $$lt$$(左指针):指向第一个元素,表示左段的末尾 - $$gt$$(右指针):指向最后一个元素,表示右段的开头 - $$i$$(遍历指针):从数组头部开始扫描 2. **遍历与交换**: - 若 $$arr[i] < pivot$$:交换 $$arr[i]$$ 与 $$arr[lt]$$,并移动 $$i$$ 和 $$lt$$ - 若 $$arr[i] > pivot$$:交换 $$arr[i]$$ 与 $$arr[gt]$$,仅移动 $$gt$$ - 若 $$arr[i] = pivot$$:仅移动 $$i$$ 3. **终止条件**: - 当 $$i$$ 与 $$gt$$ 相遇时停止遍历 4. **递归处理**: - 对左段 $$arr[0..lt-1]$$ 和右段 $$arr[gt+1..n-1]$$ 递归执行上述步骤 --- #### 3. **示例演示** 假设数组为 $$[3, 1, 2, 3, 5, 3, 4]$$,基准值 $$pivot = 3$$: - **划分后**: - 左段:$$[1, 2]$$ - 中段:$$[3, 3, 3]$$ - 右段:$$[5, 4]$$ - 后续递归仅需处理左段和右段。 --- #### 4. **时间复杂度分析** - **最好情况**(大量重复元素):$$O(n)$$ - **平均情况**:$$O(n \log n)$$ - **最坏情况**:$$O(n^2)$$(但概率极低) 与传统双路划分相比,三路划分在重复元素较多时**显著减少递归次数**。 --- #### 5. **代码框架(伪代码)** ```plaintext function quickSort3Way(arr, low, high): if low >= high: return pivot = arr[low] lt = low gt = high i = low while i <= gt: if arr[i] < pivot: swap(arr[i], arr[lt]) lt += 1 i += 1 elif arr[i] > pivot: swap(arr[i], arr[gt]) gt -= 1 else: i += 1 quickSort3Way(arr, low, lt - 1) quickSort3Way(arr, gt + 1, high) ``` --- #### 6. **适用场景** - 输入数据包含**大量重复元素** - 需要避免快速排序的最坏时间复杂度 - 例如:排序日志数据、用户评分等重复值较多的场景 --- #### 7. **总结** 三路划分通过将重复元素集中处理,优化了传统快速排序的性能瓶颈。其核心是通过**动态调整三个指针**($$lt$$、$$gt$$、$$i$$)将数组高效划分为三段,特别适合处理实际场景中的非均匀分布数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值