一、前言
在做题时遇到了求序列中第k大的值的问题(或是求中位数的问题),面对这种问题,我们通常会想:那我们只要先把整个数组快排一遍不就可以了吗。但是,如果碰到了要求你动态维护第k大的值的话,时间复杂度会大到惊人!所以我们需要一种更好的方法去处理,而这种方法就是对顶堆。
二、正文
我们都知道,堆可以在短时间内将数据维护成单调递增或单调递减的序列,但在它的实现方式——优先队列中,我们没办法进行单点查询。那我们应该怎么办呢?
仔细回想一下优先队列的相关知识,我们可以知道,优先队列虽然不支持任意点访问,但我们可以仅花O(1)的时间查询出堆顶的元素,所以我们可以通过维护对顶堆的两个堆顶元素来进行单调性的维护。
众所周知,如果有两个集合A和B,如果集合A中的最小值比集合B中的最大值还大,那么我们就能知道:集合A中的所有元素都比集合B中的元素大。根据这一方法,我们就可以想到对策:
我们可以弄两个堆,一个是大根堆,一个是小根堆,我们再将假设已经排好序的集合A从第k大的元素和第(k+1)大的元素之间切成两份,分别存在大小根堆中,再根据优先队列的特点可以得知:前k大的元素存在小根堆中,后面的元素存在大根堆中便可解决这个问题。
既然已经知道原理了,那我们就可以很快地想出解题方法:我们首先把第一个数据丢进小根堆里(避免后面出问题),然后,每读入一个数据就将它与小根堆的堆顶元素进行比较,如果比堆顶元素大就把它丢进小根堆里,否则把它丢进大根堆里,再维护一下(限定小根堆里的元素个数为k,如果当前元素个数大于k,就把小根堆的队首元素丢进大根堆里;如果当前元素个数小于k,就把大根堆的队首元素丢进小根堆里),最后小根堆的队首元素就是我们要求的答案。
当然,你也可以先把前k个数据丢进小根堆里,再进行比较,最后维护。当然,你也可以采用别的写法,只要这种做法比较适合当前的题目要求,就可以选择。
核心代码如下:
第1种方法:
int n,k,a[n]; //n为数据的个数(输出的次数),k意义与前言中的k意义相同,a数组存储要比较的序列。
priority_queue <int,vector<int>,less<int> >q1; //大根堆
priority_queue <int,vector<int>,greater<int> >q2; //小根堆
int main()
{
q2.push(a[0]);
for(int i=1;i<=n-1;i++)
{
if(a[i]>q2.top()) q2.push(a[i]);
else q1.push(a[i]);
while(q2.size()!=k&&!q2.empty()&&i+1>=k) //维护
{
if(q2.size()>k)
{
q1.push(q2.top());
q2.pop();
}
if(q2.size()<k&&!q1.empty())
{
q2.push(q1.top());
q1.pop();
}
}
}
cout<<q2.top();
}
第二种方法:
int n,k,a[n]; //n为数据的个数(输出的次数),k意义与前言中的k意义相同,a数组存储要比较的序列。
priority_queue <int,vector<int>,less<int> >q1; //大根堆
priority_queue <int,vector<int>,greater<int> >q2; //小根堆
int main()
{
for(int i=0;i<=k-1;i++)
{
q2.push(a[i]);
}
for(int i=k;i<=n-1;i++)
{
if(a[i]>q2.top()) q2.push(a[i]);
else q1.push(a[i]);
}
while(q2.size()!=k&&!q2.empty()) //维护
{
if(q2.size()>k)
{
q1.push(q2.top());
q2.pop();
}
if(q2.size()<k&&!q1.empty())
{
q2.push(q1.top());
q1.pop();
}
}
cout<<q2.top();
}
三、例题
光说不练可不行,我们来做一下题巩固一下吧:
原题地址:洛谷P1168 中位数
【题目描述】
给出一个长度为NN的非负整数序列Ai,对于所有1 ≤ k ≤ (N + 1) / 2,输出A1, A1~ A3, …,A1~ A{2k-1}的中位数。即前1,3,5,…个数的中位数。
【输入格式】
第一行为一个正整数N,表示了序列长度。
第二行包含N个非负整数Ai(Ai≤1e9)。
【输出格式】
共(n+1)/2行,第i行为A1,A3,……A{2k-1}的中位数。
【输入样例】
7
1 3 5 7 9 11 6
【输出样例】
1
3
5
6
【说明/提示】
对于20%的数据,N ≤ 100N≤100;
对于40%的数据,N ≤ 3000N≤3000;
对于100%的数据,N ≤ 100000N≤100000。
这题建议大家先思考一下,再去看我的代码。
代码放送:
#include<bits/stdc++.h>
using namespace std;
inline int read()
{
int x=0;char ch=getchar();
while(ch<'0'||ch>'9'){ch=getchar();}
while(ch>='0'&&ch<='9'){x=(x<<3)+(x<<1)+(ch^48);ch=getchar();}
return x;
}
int n,a;
priority_queue <int,vector<int>,less<int> >q1;
priority_queue <int,vector<int>,greater<int> >q2;
int main()
{
n=read();
a=read();
q2.push(a);
printf("%d\n",a);
for(int i=2;i<=n;i++)
{
a=read();
if(a>q2.top()) q2.push(a);
else q1.push(a);
while(q2.size()!=(i+1)/2)
{
if(q2.size()>(i+1)/2)
{
q1.push(q2.top());
q2.pop();
}
if(q2.size()<(i+1)/2)
{
q2.push(q1.top());
q1.pop();
}
}
if(i&1)
{
printf("%d\n",q2.top());
}
}
return 0;
}
四、结尾
以上就是我对对顶堆的理解,希望我的博客能帮助到大家。再见。
本文介绍了如何利用对顶堆解决序列中动态维护第k大值的问题,通过建立大根堆和小根堆,保证前k大元素在小根堆中,其余元素在大根堆中,从而实现高效查询。并提供了两种核心代码实现方法,以及通过洛谷P1168中位数问题进行实例解析。
2053

被折叠的 条评论
为什么被折叠?



