//3、 一个长度未知的巨型向量分布在 n 台机器上, 如何快速找到(近似)中位数?
1、如果内存足够的情况下,可以取出n台机器上的所有数据,利用快速排序算法将所有数据
排序,取中位值。快速排序算法如下。
第一种情况模拟1000000条数据,进行快排取中位值。
2、如果内存不够,可以分别对每台机器上的数据用快速排序取中位值,然后保存n条结果,最
后对n个结果进行快排,取中位值,近似为全局的中位值。
第二种情况模拟100个机器,每个机器上有1000000条数据。
*/
//快排
inline void quick(vector<int>& all, int left, int right) {
int jizhun, i, j;
if (left > right)return;//不合逻辑
jizhun = all[left];//找到基准值
i = left;//左右指针
j = right;
while (i != j) {
while (jizhun <= all[j] && i < j)j--;//从右至左找到小于基准值的
while (jizhun >= all[i] && i < j)i++;//从左至右找到大于基准值的
if (i < j)swap(all[i], all[j]);//找到后交换,使基准值左边的值小于他,右边的大于他。
}
all[left] = all[i];//把基准值放到适当的位置,符合上面的注释
all[i] = jizhun;
quick(all, left, i - 1);//左