在上篇博客中寻找数组中的第k个数时每次排序所选择的pivot是随机选择的,在这篇博客中,我采用的是算法导论中讲的一种方法(算法导论上论证了该方法在最坏的情况下其运行时间都是线性的),尽可能使得划分后pivot两边数的个数差不多,具体步骤如下:
- 将数组中[low,high]之间的数以长度5为单位,分成1 + (high - low) / 5组("/"表示整数除)
- 寻找每一组中的中位数,先将每组进行选择排序(每组最多只有5个数),然后返回其中间的数
- 每一组返回的中位数又组成了一个新的数组,然后按上面的步骤进行递归处理,当新数组中只有一个元素时就得到了我们所需要的数pivot
- 使用pivot对数组划分为三部分[low,j-1],j,[j+1,high]
- 判断j是否是第k个元素,如是就返回,否则在[low,j-1]或是[j+1,high]中进行迭代
/*寻找数组中第i大的数*/
#include <stdio.h>
#include <time.h>
#include <stdlib.h>
void swap(int *a, int *b)
{
int temp;
temp = *a;
*a = *b;
*b = temp;
}
/*选择排序,返回中间的元素*/
int SelectSort(int *arr, int low, int high)
{
int i, j;
int minIndex;
for (i = low; i < high; i++)
{
minIndex = i;
for (j = i + 1; j <= high; j++)
{
if (arr[j] < arr[minIndex])
{
minIndex = j;
}
}
swap(&arr[i], &arr[minIndex]);
}
return arr[(high + low) / 2];
}
/*选择主元,保证划分后数组两边的数尽量相等
5个元素为一组进行处理,先求的每组的中位数,然后将所有的中位数组成一个新的数组,再按5个元素为一组进行划分,求得各组的中位数组成新的数组,如此反复下去
直到只得到一组数据,其中的中位数就是所要求的中位数*/
int SelectSentinel(int *arr, int low, int high)
{
int i, j;
int left = 0;
int interval;
int *newArr;
if (low == high)
{
return arr[low];
}
j = 1 + (high - low) / 5;
newArr = (int*)malloc(sizeof(int)* j);
interval = 5;
for (i = 0; i < j - 1; ++i)
{
newArr[left++] = SelectSort(arr, low + i * interval, low + interval * (i + 1) - 1);
}
newArr[left++] = SelectSort(arr, low + interval * i, high);
if (1 == j)
{
return newArr[0];
}
else
{
return SelectSentinel(newArr, 0, left - 1);
}
free(newArr);
}
int PartitionOne(int *arr, int low, int high)
{
int sentinel = arr[high];
int i, j = low - 1; //j指向部分排序后数组中小于sentinel的最后一个节点
for (i = low; i < high; i++)
{
if (arr[i] <= sentinel)
{
j++;
swap(&arr[i], &arr[j]);
}
}
swap(&arr[j + 1], &arr[high]);
return (j + 1);
}
/*求得主元在数组中的位置*/
void SwapSentinel(int *arr, int low, int high, int sentinel)
{
int i;
for (i = low; i <= high; i++)
{
if (arr[i] == sentinel)
break;
}
swap(&arr[i], &arr[high]);
}
/*find_kth_max在寻找第k个最大的数时,对数据的划分所采用的主元是随机选择的,从而保证算法的性能是平均的*/
int find_kth_max(int *arr, int low, int high, int k)
{
int partition, i;
if (low == high)
return arr[low];
SwapSentinel(arr, low, high, SelectSentinel(arr, low, high));
partition = PartitionOne(arr, low, high);
i = partition - low + 1;
if (i == k)
return arr[partition];
else if (i < k)
{
return find_kth_max(arr, partition + 1, high, k - i);
}
else
{
return find_kth_max(arr, low, partition - 1, k);
}
}
int main()
{
int arr[10010];
int i, N;
while (EOF != scanf("%d", &N))
{
for (i = 0; i < N; ++i)
scanf("%d", &arr[i]);
printf("%d\n", find_kth_max(arr, 0, N - 1, (N - 1) / 2 + 1));
}
return 0;
}