求第k小元素问题
k小元素问题是利用分治法进行求解的经典问题之一。
问题描述
已知一个长度为n的数组,返回数组中的第k小的元素。
有些问题中求解的是第k大元素,方法类似。
分析设计
要想找出第k小的元素,我们首先想到的方法肯定是先将数组进行排序,返回第k个元素即可,然而利用排序的方法求解时间复杂度至少为O(nlogn),是否存在一种算法使得时间复杂度为O(n)?
分治法
当数组长度,即问题规模很大时,分治法是一种很好的算法解决该问题。当问题规模达到一定的阈值时,分治法就具有较高的效率。在求第k小元素中,该阈值为44,即数组长度超过44时,采用分治法会获得较高小效率。
(在实际编程测试中,由于测试数据较小,我采用的阈值为5。)
利用分治法求解的基本思路为:
- 当问题规模小于阈值时,直接采用排序算法返回结果。(我使用的是归并排序。)
- 当问题规模大于阈值时,我们将n个元素以5个一组,划分为n/5组(剩余元素一组,不会有影响),分别排序找出中位数,将所有中位数放入一个数组中,重复第2步,最终得到整个数组的中位数m。(其中的数学原理不再赘述。)
- 将整个数组分为3个部分:a1,a2,a3,分别代表小于、等于、大于m的元素。
- 存在三种情况:
(1). 若a1的元素个数大于等于k,则第k小元素在 a1中,在a1中递归查找第k小元素;
(2). 若a1、a2的元素个数之和大于等于k,则中位数m即为第k小元素,返回m;
(3). 否则,第k小元素在a3中,在a3中递归查找第(k - (a1.length + a2.length))小元素。
源代码
#include <iostream>
#include <vector>
using namespace std;
//归并排序
void merge(int a[], int start1, int end1, int start2, int end2) {
int i = start1, j = start2;
int n = (end1 - start1 + 1) + (end2 - start2 + 1);
vector<int> temp(n);
int k = 0;
while (i <= end1 && j <= end2) {
if (a[i] < a[j]