7:中位数
总时间限制:2000ms 内存限制:65536kB
描述
中位数定义:一组数据按从小到大的顺序依次排列,处在中间位置的一个数或最中间两个数据的平均值(如果这组数的个数为奇数,则中位数为位于中间位置的那个数;如果这组数的个数为偶数,则中位数是位于中间位置的两个数的平均值).
给出一组无序整数,求出中位数,如果求最中间两个数的平均数,向下取整即可(不需要使用浮点数)
输入
该程序包含多组测试数据,每一组测试数据的第一行为N,代表该组测试数据包含的数据个数,1 <= N <= 15000.
接着N行为N个数据的输入,N=0时结束输入
输出
输出中位数,每一组测试数据输出一行
样例输入
4
10
30
20
40
3
40
30
50
4
1
2
3
4
0
样例输出
25
40
2
PS:这道题目第一反应是对数组进行排序,然后求出中位数即可,这种方法的时间复杂度主要在于排序,如果用归并排序,是O(NlogN),N是数组元素个数。似乎这样做并不能AC,博主在此使用了分治法(Divide and Conquer)进行求解,而且注意到,求中位数只是求第k大或者第k小的一个特例,因此程序中以后者为求解目标,将k设置为对应中位数的值。平均复杂度降低到O(N)。
思路:
- 只是找中位数,即中位数(记作:median)左边的元素都比median小/大,右边的元素都比median大/小。而不需要完全要求左右的元素排好序。
- 利用快排的思想,寻找中心元pivot,将数组元素分为两部分,左边的都小于pivot,记作数组 S−S-S−,大小为∣S−∣|S-|∣S−∣, 右边的都大于pivot,记作数组 S+S+S+, 大小为∣S+∣|S+|∣S+∣,如果∣S−∣=k−1|S-|=k-1∣S−∣=k−1,那么中心元pivot就是要寻找的第k小/大,否则,在S−S-S−或者 S+S+S+中递归调用,寻找元素。
代码
#include<iostream>
#include<climits>
using namespace std;
//下面的是climits中定义的最大最小:https://blog.youkuaiyun.com/sodacoco/article/details/79629208
//#define INT_MAX 2147483647
//#define INT_MIN (-INT_MAX - 1)
void Swap(int &a,int &b)
{
int tmp=a;
a=b;
b=tmp;
}
//使用快排中Lomuto’s 的partition策略,另一种是Hoares’的partition策略
int Partition(int arr[],int l,int r)
{
int tmp=arr[r],i=l;//i用来标记当前pivot的位置,j用来扫描数组
for(int j=l; j<r; j++)
{
if(arr[j]<tmp)
{
Swap(arr[i],arr[j]);
i++;
}
}
Swap(arr[i],arr[r]);
return i;
}
int kthLargest(int arr[],int l,int r,int k)
{
if(k>0&&k<=r-l+1)
{
int pos=Partition(arr,l,r);
if(pos-l == k-1)
return pos;
else if(pos-l > k-1)
return kthLargest(arr,l,pos-1,k);//相当于S-
else
return kthLargest(arr,pos+1,r,k-pos+l-1);//相当于k-(S—)-1
}
return INT_MAX;//Maximum value for an object of type int,32767 (215-1) or greater*
}
int sub(int a ,int b)
{
return a-b;
}
int main()
{
int N;
while(cin>>N && N!=0)
{
int arr[N];
for(int i=0;i<N;i++)
cin>>arr[i];
int result=kthLargest(arr,0,N-1,N/2+1);
// for(int i=0;i<N;i++)
// cout<<arr[i]<<" ";
// cout<<endl<<"pos:"<<result<<endl;
//
//这里不同于一般的求第k小,对于数组元素个数为偶数个,需要做一点特殊处理,要找两个元素。
if(N%2!=0)
cout<<arr[result]<<endl;
else
{
//gap用于记录比pivot小的元素中,最大的那个(即gap最小的那个),从而和pivot一起计算中位数
int gap=INT_MAX,tmp=0; //弄清楚这里的gap到底是初始化为MAX还是MIN
for(int i=0;i<result;i++)
{
int sub_result=sub(arr[result],arr[i]);
if(sub_result <= gap)
{
tmp=arr[i];
gap=sub_result;
}
}
//cout<<arr[result]<<":"<<tmp<<endl;
cout<<(tmp+arr[result])/2<<endl;
}
}
return 0;
}
运行结果
PS:好像用堆实现代码会简洁点,等学会堆了试一下~