Codeforces Round #426 (Div. 1) B. The Bakery(区间内不同数个数+dp)_区间本质不同数 codeforces-优快云博客

本文链接：https://blog.youkuaiyun.com/qq_37025443/article/details/102724133

本篇博客探讨了Codeforces Round #426 (Div. 1) B. The Bakery问题，涉及如何将一个数组分成连续的k段，使权值之和最大，权值是段内不同数的个数。文章介绍了动态规划的思路和使用线段树优化的方法，包括两种线段树建树策略，重点在于如何利用线段树快速求解区间内不同数的个数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

题目链接:http://codeforces.com/problemset/problem/833/B

题意：
给你一个长度为n的数组a,让你把它分成连续的k段(数组里数的顺序不能改变)
使得权值之和最大。每一段的权值就是该段内不同数的个数

解析：
拼多多笔试的时候做到，所以赛后找了道一样的题目补一下。

一开始看到这题，以为是用斜率dp来做，后来写出公式之后
发现不能很好地用斜率表示。

这里的dp方程就是 $\le w \le j$

$d p [i] [j]$ 表示前j个数，分成i个段的最大权值

这道题的关键其实就是求区间内不同数的个数。
之前我有做到这一类题目（链接），但没有用线段树的方法解决过。

用线段树求区间内不同数的个数，就是不能在线查询（所以可以用主席树来弥补这一点，来实现在线查询）

用线段树来求区间内不同数，我目前知道的有两种建树方法。
假定现在遍历到第r个点，
也就是说现在只能查询以r为区间右边界的区间( $[i,r],i\le r$ )的值
1、第一种方法，叶子结点(表示的下标是 $l_i$ )的值表示 $a[l_i]$ 这个数在 $[1, r]$ 内是不是最后一次出现（是的话，值为1，否则为0），而每次回溯到非叶子结点（表示 $l_i,r_i]$ ）就是一个求和的过程，非叶子结点的值就是其左右孩子的值之和，表示对于 $[1, r]$ ， $l_i,r_i]$ 内有多少个最后出现的数。

那么我们遍历到位置 $r$ 更新的时候，就只需要将 $a [r]$ 这个数上一次出现的位置处的叶子结点值-1，把 $r$ 这个叶子结点值+1；
查询 $[l, r]$ 的时候，遍历到 $l$ 位置的叶子结点，向上回溯只需要将每一个右子树的值加上去，最后得到的就是答案了。

2、第二种方法，叶子结点(表示的下标是 $l_i$ )的值表示 $l_i,r]$ 区间内不同数的个数，而对于非叶子结点（表示 $l_i,r_i]$ ）可以做一个取最值或其他的操作，来表示 $[k, r]$ ( $l_i \le k \le r_i$ )内哪个区间的不同数的个数最多等等。

那么我们遍历到位置 $r$ 更新的时候，记 $a [r]$ 这个数上一次出现的位置 $b f$ ,只需要对线段树做一次区间为 $(b f, r]$ 的区间更新，增加的权值为1。
查询 $[l, r]$ 的时候，遍历到 $l$ 位置的叶子结点的值就是答案。
而如果要找 $[k, r]$ ( $l_i \le k \le r_i$ )这个些区间内值最大的区间，那么只需要做一次查询区间为 $l_i , r_i]$ 区间查询就可以了

注意：这里如果要查询以r为区间右边界的区间( $[i,r],i\le r$ )的值，必须要一步步迭代到 $r$ 这个位置（即之前的每一个位置都已经更新过线段树了），不能直接对 $r$ 进行建树，这也是为什么他不能进行在线的原因。如果题目需要在线，那么我们只需要用熟悉主席树保存每一次迭代的线段树，然后按照查询区间的右边界到对应的线段树去找答案就可以了

再说回这道题，上面写出的式子，主要是在时间复杂度上过不了(N太大了)，那么我们主要优化的就是如何快速得到 $\le w \le j$

对于sum[]这个数组打表预处理的话，肯定是不行的（N*N空间放不下）。
那么就可以用线段树来做，而上面两种方法选择哪一种？如果用第一种，我们只能求出 $s u m [w . . . j]$ 对于时间复杂度根本没有优化，还是要遍历n次去找最大值。
那么用第二种方法,因为 $d p [i - 1]$ 对于 $d p [i]$ 的求解都是固定的（常量），那么就先把 $d p [i - 1]$ 加到线段树的叶子结点里面，现在每一个叶子结点的值(表示的下标是 $l_i$ )就代表 $1,l_i-1]$ 分成 $i - 1$ 个区间的值+ $l_i,r]$ 的值
最后做一个区间查询，就可以得到 $d p [i] [j]$ 的值了

#include <cstdio>
#include <cstring>
#include <algorithm>
#define lch (rt<<1)
#define rch ((rt<<1)|1)
using namespace std;
 
 
const int N = 35000+10;
 
int a[N];
 
int dp[2][N];
 
int Segtree[N<<2];
int mark[N<<2];
int bef[N];
int number[N];
 
 
void pushdown(int rt)
{
	if(mark[rt])
	{
		Segtree[lch]+=mark[rt];
		Segtree[rch]+=mark[rt];
 
		mark[lch]+=mark[rt];
		mark[rch]+=mark[rt];
		mark[rt]=0;
	}
}
 
 
void build(int rt,int l,int r,int * val)
{
	if(l==r)
	{
		Segtree[rt]=val[l-1];
		mark[rt]=0;
		return;
	}
	mark[rt]=0;
	int mid = (l+r)>>1;
	build(lch,l,mid,val);
	build(rch,mid+1,r,val);
	//push up
	Segtree[rt]=max(Segtree[lch],Segtree[rch]);
}
 
void update(int rt,int l,int r,int s,int e,int val)
{
	if(s<=l&&r<=e)
	{
		Segtree[rt]+=val;
		mark[rt]+=val;
		return;
	}
	pushdown(rt);
	int mid = (l+r)>>1;
 
	if(s<=mid)
		update(lch,l,mid,s,e,val);
	if(e>=mid+1)
		update(rch,mid+1,r,s,e,val);
	//push up
	Segtree[rt]=max(Segtree[lch],Segtree[rch]);
}
 
 
int query(int rt,int l,int r,int s,int e)
{
	if(s<=l&&r<=e)
		return Segtree[rt];
	pushdown(rt);
	int mid = (l+r)>>1;
	int ans=0;
	if(s<=mid)
		ans=max(ans,query(lch,l,mid,s,e));
	if(e>=mid+1)
		ans=max(ans,query(rch,mid+1,r,s,e));
	return ans;
}
 
 
 
int main()
{
	int n,m;
	scanf("%d%d",&n,&m);
	memset(number,0,sizeof(number));
	for(int i=1;i<=n;i++)
	{
		scanf("%d",&a[i]);
		bef[i]=number[a[i]];
		number[a[i]]=i;
	}
	int now=0;
	int nex;
	memset(dp[now],0,sizeof(dp[now]));
	for(int i=1;i<=m;i++)
	{
		nex=now^1;
		build(1,1,n,dp[now]);
		//memset(dp[nex],0,sizeof(dp[nex]));
		for(int j=i;j<=n;j++)
		{
			update(1,1,n,bef[j]+1,j,1);
			dp[nex][j]=query(1,1,n,i,j);
		}
		now=nex;
	}
	printf("%d\n",dp[now][n]);
 
}