题目链接:http://codeforces.com/problemset/problem/833/B
题意:
给你一个长度为n的数组a,让你把它分成连续的k段(数组里数的顺序不能改变)
使得权值之和最大。每一段的权值就是该段内不同数的个数
解析:
拼多多笔试的时候做到,所以赛后找了道一样的题目补一下。
一开始看到这题,以为是用斜率dp来做,后来写出公式之后
发现不能很好地用斜率表示。
这里的dp方程就是 d p [ i ] [ j ] = m a x ( d p [ i − 1 ] [ w − 1 ] + s u m [ w . . . j ] ) , i ≤ w ≤ j dp[i][j]=max(dp[i-1][w-1]+sum[w...j]), i \le w \le j dp[i][j]=max(dp[i−1][w−1]+sum[w...j]),i≤w≤j
d p [ i ] [ j ] dp[i][j] dp[i][j]表示前j个数,分成i个段的最大权值
这道题的关键其实就是求区间内不同数的个数。
之前我有做到这一类题目(链接),但没有用线段树的方法解决过。
用线段树求区间内不同数的个数,就是不能在线查询(所以可以用主席树来弥补这一点,来实现在线查询)
用线段树来求区间内不同数,我目前知道的有两种建树方法。
假定现在遍历到第r个点,
也就是说现在只能查询以r为区间右边界的区间(
[
i
,
r
]
,
i
≤
r
[i,r],i\le r
[i,r],i≤r)的值
1、第一种方法,叶子结点(表示的下标是
l
i
l_i
li)的值表示
a
[
l
i
]
a[l_i]
a[li]这个数在
[
1
,
r
]
[1,r]
[1,r]内是不是最后一次出现(是的话,值为1,否则为0),而每次回溯到非叶子结点(表示
[
l
i
,
r
i
]
[l_i,r_i]
[li,ri])就是一个求和的过程,非叶子结点的值就是其左右孩子的值之和,表示对于
[
1
,
r
]
[1,r]
[1,r],
[
l
i
,
r
i
]
[l_i,r_i]
[li,ri]内有多少个最后出现的数。
那么我们遍历到位置
r
r
r更新的时候,就只需要将
a
[
r
]
a[r]
a[r]这个数上一次出现的位置处的叶子结点值-1,把
r
r
r这个叶子结点值+1;
查询
[
l
,
r
]
[l,r]
[l,r]的时候,遍历到
l
l
l位置的叶子结点,向上回溯只需要将每一个右子树的值加上去,最后得到的就是答案了。
2、第二种方法,叶子结点(表示的下标是 l i l_i li)的值表示 [ l i , r ] [l_i,r] [li,r]区间内不同数的个数,而对于非叶子结点(表示 [ l i , r i ] [l_i,r_i] [li,ri])可以做一个取最值或其他的操作,来表示 [ k , r ] [k,r] [k,r]( l i ≤ k ≤ r i l_i \le k \le r_i li≤k≤ri)内哪个区间的不同数的个数最多等等。
那么我们遍历到位置
r
r
r更新的时候,记
a
[
r
]
a[r]
a[r]这个数上一次出现的位置
b
f
bf
bf,只需要对线段树做一次区间为
(
b
f
,
r
]
(bf,r]
(bf,r]的区间更新,增加的权值为1。
查询
[
l
,
r
]
[l,r]
[l,r]的时候,遍历到
l
l
l位置的叶子结点的值就是答案。
而如果要找
[
k
,
r
]
[k,r]
[k,r](
l
i
≤
k
≤
r
i
l_i \le k \le r_i
li≤k≤ri)这个些区间内值最大的区间,那么只需要做一次查询区间为
[
l
i
,
r
i
]
[l_i , r_i]
[li,ri]区间查询就可以了
注意:这里如果要查询以r为区间右边界的区间( [ i , r ] , i ≤ r [i,r],i\le r [i,r],i≤r)的值,必须要一步步迭代到 r r r这个位置(即之前的每一个位置都已经更新过线段树了),不能直接对 r r r进行建树,这也是为什么他不能进行在线的原因。如果题目需要在线,那么我们只需要用熟悉主席树保存每一次迭代的线段树,然后按照查询区间的右边界到对应的线段树去找答案就可以了
再说回这道题,上面写出的式子,主要是在时间复杂度上过不了(N太大了),那么我们主要优化的就是如何快速得到 m a x ( d p [ i − 1 ] [ w − 1 ] + s u m [ w . . . j ] ) , i ≤ w ≤ j max(dp[i-1][w-1]+sum[w...j]), i \le w \le j max(dp[i−1][w−1]+sum[w...j]),i≤w≤j
对于sum[]这个数组打表预处理的话,肯定是不行的(N*N空间放不下)。
那么就可以用线段树来做,而上面两种方法选择哪一种?如果用第一种,我们只能求出
s
u
m
[
w
.
.
.
j
]
sum[w...j]
sum[w...j]对于时间复杂度根本没有优化,还是要遍历n次去找最大值。
那么用第二种方法,因为
d
p
[
i
−
1
]
dp[i-1]
dp[i−1]对于
d
p
[
i
]
dp[i]
dp[i]的求解都是固定的(常量),那么就先把
d
p
[
i
−
1
]
dp[i-1]
dp[i−1]加到线段树的叶子结点里面,现在每一个叶子结点的值(表示的下标是
l
i
l_i
li)就代表
[
1
,
l
i
−
1
]
[1,l_i-1]
[1,li−1]分成
i
−
1
i-1
i−1个区间的值+
[
l
i
,
r
]
[l_i,r]
[li,r]的值
最后做一个区间查询,就可以得到
d
p
[
i
]
[
j
]
dp[i][j]
dp[i][j]的值了
#include <cstdio>
#include <cstring>
#include <algorithm>
#define lch (rt<<1)
#define rch ((rt<<1)|1)
using namespace std;
const int N = 35000+10;
int a[N];
int dp[2][N];
int Segtree[N<<2];
int mark[N<<2];
int bef[N];
int number[N];
void pushdown(int rt)
{
if(mark[rt])
{
Segtree[lch]+=mark[rt];
Segtree[rch]+=mark[rt];
mark[lch]+=mark[rt];
mark[rch]+=mark[rt];
mark[rt]=0;
}
}
void build(int rt,int l,int r,int * val)
{
if(l==r)
{
Segtree[rt]=val[l-1];
mark[rt]=0;
return;
}
mark[rt]=0;
int mid = (l+r)>>1;
build(lch,l,mid,val);
build(rch,mid+1,r,val);
//push up
Segtree[rt]=max(Segtree[lch],Segtree[rch]);
}
void update(int rt,int l,int r,int s,int e,int val)
{
if(s<=l&&r<=e)
{
Segtree[rt]+=val;
mark[rt]+=val;
return;
}
pushdown(rt);
int mid = (l+r)>>1;
if(s<=mid)
update(lch,l,mid,s,e,val);
if(e>=mid+1)
update(rch,mid+1,r,s,e,val);
//push up
Segtree[rt]=max(Segtree[lch],Segtree[rch]);
}
int query(int rt,int l,int r,int s,int e)
{
if(s<=l&&r<=e)
return Segtree[rt];
pushdown(rt);
int mid = (l+r)>>1;
int ans=0;
if(s<=mid)
ans=max(ans,query(lch,l,mid,s,e));
if(e>=mid+1)
ans=max(ans,query(rch,mid+1,r,s,e));
return ans;
}
int main()
{
int n,m;
scanf("%d%d",&n,&m);
memset(number,0,sizeof(number));
for(int i=1;i<=n;i++)
{
scanf("%d",&a[i]);
bef[i]=number[a[i]];
number[a[i]]=i;
}
int now=0;
int nex;
memset(dp[now],0,sizeof(dp[now]));
for(int i=1;i<=m;i++)
{
nex=now^1;
build(1,1,n,dp[now]);
//memset(dp[nex],0,sizeof(dp[nex]));
for(int j=i;j<=n;j++)
{
update(1,1,n,bef[j]+1,j,1);
dp[nex][j]=query(1,1,n,i,j);
}
now=nex;
}
printf("%d\n",dp[now][n]);
}