算法思想
递归算法,空间换时间,足够大的数据量下时间复杂度可以在O(n)。每次递归划分后,丢弃一部分元素,问题规模缩小到一定程度可以快排取数。理论上在线性时间找到,是一种选择问题。
算法步骤:
- 设定阈值,个数小于它就直接快排取数
- 数组大小为p,5个一组,分q组
- 每一组找出中位数,记录在M[],再在M[]中找出中位数mm
- 对于原数组小于mm的放数组A1,等于的A2,大于的A3
- 三种情况递归,,一是第k小在A1中,二是在A2中,三是在A3中
对照思路的伪代码:
/** 找第k小元素的函数*/
public static int selectK(int[] A,int low,int high,int k) {
int p = high - low +1;
if p<4 //阈值设4
Arrays.sort(A);
return A[k-1]; //注意哈 第k小对应下标k-1
int q =p/5; //我们搞5个一组来
int MM[q];
for i in range(q):
MM[i] = SelectMid(A,i*5,i*5+4);
int mm= SelectK(MM,0,q-1,(int)Math.ceil(q/2.0)); //向上取整得到中位数
A1 k1 A2 k2 A3 k3; 赋值
if(k<=k1) SelectK(A1,0,k1-1,k);
if(k<=k1+k2) return mm;
Select(A3,0,k3-1,k-k1-k2);
完整代码:
/** 找中项 */
public static int selectMid(int A[], int low, int high) {
Qsort(A, low, high);
return A[low + (high - low) / 2];
}
/** 寻找第k小项 */
public static int selectK(int[] A, int low, int high, int k) {
int p = high - low + 1; //用下标计算传入数组的真实大小
if (p < 4) { //阈值 小到某种程度就快排 第k小取k-1下标
Qsort(A, low, high);
return A[k-1];
}
int q = p / 5; //分组 只是为了取一个mm 来划分三个数组
int[] M = new int[q];
for (int i = 0; i < q; i++) {
M[i] = selectMid(A, i * 5, i * 5 + 4);
}
int mm = selectK(M, 0, q - 1, (int)Math.ceil(q/2.0)); //递归取到 分组中项的中项
int[] A1 = new int[p];
int k1 = 0;
int[] A2 = new int[p];
int k2 = 0;
int[] A3 = new int[p];
int k3 = 0;
for (int i = 0; i < p; i++) {
if (A[i] < mm) {
A1[k1++] = A[i];
} else if (A[i] == mm) {
A2[k2++] = mm;
} else {
A3[k3++] = A[i];
}
}
if (k <= k1) { //k在数组A中 递归他
return selectK(A1, 0, k1 - 1, k);
}
if (k <= k1 + k2) { //经过上个if判断 这个就是说k就是mm k2全是mm
return mm;
}
if (k > k1 + k2) { //就是说 k在数组c中 再递归他,找k-k1-k2小数
return selectK(A3, 0, k3 - 1, k - k1 - k2);
}
return -1;
}