题意:
给出一个长 n n n的序列 a a a,可以选择一个区间 [ l , r ] [l,r] [l,r],使得这个区间的所有元素的 + k +k +k,求最后最大的众数出现次数
Solution:
假设当前众数为 x x x,我们应当想办法使 x x x更多,显然,此时答案只与 x , x − k x,x-k x,x−k有关系,不妨只考虑这两个数形成的序列,这可以预处理一个桶,随后将位置加入栈中即可。形成序列后,不妨假设我们选择区间为里面的 [ l , r ] [l,r] [l,r],并且序列长度为 m m m,那么答案为
X 1 , l − 1 + ( r − l + 1 − ( X l , r ) ) + X r + 1 , m X_{1,l-1}+(r-l+1-(X_{l,r}))+X_{r+1,m} X1,l−1+(r−l+1−(Xl,r))+Xr+1,m
其中 X l , r X_{l,r} Xl,r为区间 [ l , r ] [l,r] [l,r]中 x x x的出现次数,不妨用前缀和展开,得到
s u m [ l − 1 ] + r − l + 1 − s u m [ r ] + s u m [ l − 1 ] + s u m [ m ] − s u m [ r ] sum[l-1]+r-l+1-sum[r]+sum[l-1]+sum[m]-sum[r] sum[l−1]+r−l+1−sum[r]+sum[l−1]+sum[m]−sum[r]
即
2 × s u m [ l − 1 ] − ( l − 1 ) + r − 2 × s u m [ r ] + s u m [ m ] 2\times sum[l-1]-(l-1)+r-2\times sum[r]+sum[m] 2×sum[l−1]−(l−1)+r−2×sum[r]+sum[m]
对于区间问题,有一个经典方法,固定一个端点,优化另一个端点的选取时间,这里不妨选取 r r r,那么只需要以下最大
2 × s u m [ l − 1 ] − ( l − 1 ) 2\times sum[l-1]-(l-1) 2×sum[l−1]−(l−1)
即只需要维护 2 × s u m [ i ] − i 2\times sum[i]-i 2×sum[i]−i的前缀最大值,就可以 O ( 1 ) O(1) O(1)转移
需要注意的是,选取了 r r r,那么 l ∈ [ 1 , r ] l\in[1,r] l∈[1,r],从而 l − 1 ∈ [ 0 , r − 1 ] l-1\in[0,r-1] l−1∈[0,r−1],于是需要从 m a x 1 [ r − 1 ] max1[r-1] max1[r−1]转移,而非 m a x 1 [ r ] max1[r] max1[r]
枚举众数,众数只可能是原序列的数,此时加入 x x x与 x − k x-k x−k,显然每个数的桶最多被加入 2 2 2次,于是总复杂度是 O ( n ) O(n) O(n)的,但是为了不重复地枚举众数,利用 s e t set set或者排序去重时间复杂度是 O ( n l o g n ) O(nlogn) O(nlogn),利用桶来标记某个数是否被处理过,这样的总复杂度就仍然是 O ( n ) O(n) O(n)的
#include<bits/stdc++.h>
using namespace std;
using ll=long long;
const int N=2000005,inf=0x3fffffff;
const long long INF=0x3f3f3f3f3f3f,mod=998244353;
int n,k,a[N],ans,sum[N],max1[N],s[N],cnt;
set<int>set1;
vector<vector<int>>pos(N<<1);
void input(int x,int y)
{
int i=0,j=0; cnt=0;
while(i<pos[x+N].size()&&j<pos[y+N].size())
{
if(pos[x+N][i]<pos[y+N][j]) s[++cnt]=pos[x+N][i++];
else s[++cnt]=pos[y+N][j++];
}
while(i<pos[x+N].size()) s[++cnt]=pos[x+N][i++];
while(j<pos[y+N].size()) s[++cnt]=pos[y+N][j++];
}
void solve(int x,int y)
{
input(x,y);
for(int i=1;i<=cnt;i++)
{
sum[i]=sum[i-1]+(a[s[i]]==x);
max1[i]=max(max1[i-1],2*sum[i]-i);
ans=max(ans,(int)pos[x+N].size()+i-2*sum[i]+max1[i-1]);
}
}
int main()
{
cin>>n>>k;
for(int i=1;i<=n;i++)
{
scanf("%d",&a[i]);
pos[a[i]+N].push_back(i);
set1.insert(a[i]);
}
for(auto x:set1)
{
ans=max(ans,(int)pos[x+N].size());
if(!pos[x-k+N].empty()) solve(x,x-k);
}
cout<<ans;
return 0;
}