感谢
文本中所选题目均来自于这里,感兴趣可以看看其它题,在这里特表感谢。
介绍
S O S ( S u m O v e r S u b s e t s ) D P SOS (Sum Over Subsets) DP SOS(SumOverSubsets)DP,即子集 D P DP DP,属于状压 D P DP DP的一种类型,可用于解决:
- 选择任意多个不重复的箱子,使每种物体至少选一个的方案数。
- 有 n n n 个数,需要在 1 1 1 ~ K K K( 1 < K ≤ n 1<K≤n 1<K≤n)的区间内选择 2 2 2个数,使这 2 2 2个数的二进制与为 0 0 0。
但事实上, S O S D P SOS DP SOSDP能解决的问题不止这些,仔细观察这些问题,也许你会发现它们都有一个共同点——信息传递的纽带是集合间的包含关系。
但事实上,在没有分析这些问题前,是很难发现这一点的,因此我会在具体分析本题和 S O S D P SOS DP SOSDP的原理前,详细分析这三种问题。
补充
子数、原数
若一个二进制数 a a a 的每一位都 ≤ 另一个二进制数 b b b ( a 、 b a、b a、b 可以相等),则称 a a a 是 b b b 的子数, b b b 是 a a a 的原数。
一些简单结论
- 若集合 A 、 B 、 C A、B、C A、B、C 满足 A ⊆ B , B ⊆ C A ⊆ B,B ⊆ C A⊆B,B⊆C ,则有 A ⊆ C A ⊆ C A⊆C。
- 在二进制下,若 A A A 是 B B B 的子数,则有 A ≤ B A ≤ B A≤B。
分析
问题一
该问题的题面为:
有 n n n 个集合和 m m m 个元素,第 i i i 集合中有 k k ki 个元素: a a ai1 、 a a ai2 … a a aik ,你需要求取出 X X X ( 1 ≤ X ≤ n 1 ≤ X ≤ n 1≤X≤n )个集合且这些集合合并为一个大集合后包含 m m m 个元素的方案数。
定义两个方案不同当且仅当至少存在一个集合,在其中一个方案中被选择,在另一个方案中未被选择。
这种题目最暴力的做法当然是暴力枚举所有可能然后判断是否合法。
如果你学过状压 D P DP DP,也许会灵光一闪,将 m m m 个元素的选择转化为二进制数组 n u m num num (选和不选)以此来表示每个集合,然后试图用状压DP去解决这一问题,接着就被卡在了状态转移方程不好写。
当你把每个集合的状态压缩为整数之后,每个集合都拥有了自己的二进制编号,而答案集合从第 0 0 0 位到第 m − 1 m-1 m−1 位上的数字均为 1 1 1 。
根据题意分析,就可以发现多个集合合并后的集合的二进制,其实就是多个集合对应的二进制的或和,合并操作其实就是二进制或!
再随便举个例子,比如 0110 0110 0110 要得到答案数 1111 1111 1111,则必须要和形如 1 X X 1 1XX1 1XX1 ( X X X 表示 0 0 0 或 1 1 1 )的二进制数进行或操作,而 0110 0110 0110 取反后的数是 1001 1001 1001,是符合条件的最小数,故用该数的取反数是一定可以的。
同时, 1011 、 1101 、 1111 1011、1101、1111 1011、1101、1111 也是可以的,而 1000 1000 1000 则不行。观察这四个数和 1001 1001 1001 的关系,就可以发现:取反数 ∈ ∈ ∈ 符合条件的二进制数的子数集!
该结论的证明可以感性证明一下:
根据子数的定义可得,对于每一位,一定有原数 ≥ 子数,而二进制的或操作从本质上来看,其实就是对两个二进制数的每一位取最大,故而若子数符合条件,原数一定符合条件。
又取反数是最小的符合条件的数,一定有子数 ≤ 原数,故一定有取反数 ∈ ∈ ∈ 符合条件的二进制数的子数集,得证。
分析到这里之后,你就会发现状态转移方程还是很难写出来,想要求这个方案数好像只能用容斥原理,但是不好写,因为想要求二进制数 x ∈ x ∈ x∈ 或和的子数集的方案数很难。
这个时候若是你不信邪,硬要去思考一下如果要用容斥怎么写,也许就会发现为什么很难求解:
某个二进制数的某一位为 1 1 1 ,则或和的这一位一定为 1 1 1 ,但或和的某一位为 1 1 1 无法推出每个二进制数的这一位都为 1 1 1 ,即子或和可以确定总或和,而总或和无法确定子或和。
而在这个问题中,信息是由总传递给子的,故而用或和很难实现。
但是,与和则恰恰相反,它的信息是由总与和传递给子与和的,正好符合本题的信息传递特性,故而我们可以从与和的角度思考问题,举个例子:
1011 ∣ 1100 = 1111 1011 | 1100 = 1111 1011∣1100=1111 ,符合条件。
将三个数取反、把或改成与,就会很惊奇的发现:
0100 0100 0100 & 0011 = 0000 0011 = 0000 0011=0000 ,等式仍成立!
于是这种问题又可以换个思路了:
把所有数取反,求多个二进制数的与和为 0 0 0 的方案数,而这可以利用容斥原理来解决。
设函数 f ( x ) f(x) f(x) 表示 x = x = x= 多个集合与和的方案数, g ( x ) g(x) g(x) 表示子数集包括 x x x 的数的数量,则有:
f ( x ) = 2 g ( x ) − 1 f(x) = 2^{g(x)}-1 f(x)=2g(x)−1。
g ( x ) = ∑ i = 1 n [ n u m i g(x)=\sum_{i=1}^{n}[num_i g(x)=∑i=1n[numi & x = = x ] ⋅ g ( i ) x==x] \cdot g(i) x==x]⋅g(i)。
而 g ( x ) g(x) g(x) 的转移方程正是 S O S D P SOS DP SOSDP所优化的对象,具体怎么做下文会有具体说明。
问题二
问题二与问题一相比最大的不同就是只选择两个数来对答案产生贡献,且选择的数有一定的限制。
这个问题其实就是求区间问题,所以一个最朴素的观察就是最终答案一定是区间所有答案中的最优答案。而问题在于,如何获取答案呢?
为了方便获取答案,我们把该题的答案设为所有答案中最大的那个。
感性发现一下,可以得出该结论:如果二进制数 a a a & b = 0 b=0 b=0,则必有 b b b 是 a a a 的相反数的子数。
何以见得?
首先,设二进制数 a a a 的取反数为 b b b ,则必有 a a a & b = 0 b=0 b=0
思考一下二进制与运算的本质,可以发现二进制与运算其实就是取每一位的最小值。
若二进制数 a a a & c = 0 c=0 c=0,则两数的每一位的最小值一定为 0 0 0,而 b b b 是 a 中为 0 0 0 的数均为 1 1 1 的满足 a a a& b = 0 b=0 b=0的数,即 a 、 c a、c a、c中的每一位一定是 ( 0 , 1 ) (0,1) (0,1) 的模式,而 a 、 c a、c a、c 中每一位则有可能是 ( 0 , 0 ) (0,0) (0,0) 的模式,又由于 a a a 不变,故而 1 1 1 的变化一定出现在 b 、 c b、c b、c 上,即每一位上一定有 b ≥ c b≥c b≥c ,由此可知 b ≥ c b≥c b≥c 且 c c c 是 b b b 的子数,得证。
于是我们设 f ( x ) f(x) f(x) 表示子数集包含 x x x 的数,则有:
对于所有 i ≥ 0 i≥0 i≥0 ,当 2 i 2^i 2i & x = 2 i x=2^i x=2i 时, f ( x ) = max ( f ( x ) , f ( x − 2 i ) ) f(x) = \max(f(x),f(x-2^i)) f(x)=max(f(x),f(x−2i))。
对于所有 0 ≤ i ≤ K 0≤i≤K 0≤i≤K , a n s = max ( a n s , f ( i ) ) ans=\max(ans,f(i)) ans=max(ans,f(i))。
实现
根据状态转移方程可以发现,最暴力的方法是O( 4 n 4^n 4n) ,只需要枚举所有集合以及每个集合的子集即可,但是这太暴力的,肯定不优,考虑如何优化。
根据上述问题的分析,我们可以发现,答案信息具有传递性,不是从原数传递到子数就是从子数传递到原数。根据这个传递性,我们可以往如何减少每次传递答案信息时所使用的子数个数这一方向上思考。
根据集合的性质可以发现,包含关系具有传递性,而事实上子数和原数之间也是存在这一关系的,类比集合即可。
根据这一性质可以发现,我们在统计某一个数的答案时,只需要把与它只相差 1 1 1 位的子数的完整答案统计过来即可,代码如下:
for(int i=0;i<(1<<n);i++){
f[i][-1]=A[i];//A数组保存了输入时就已经统计的答案信息
for(int j=0;j<n;j++){
if(i&(1<<j)){
//此处写转移方程
}
else{
dp[i][j]=dp[i][j-1];
}
}
f[i]=dp[i][n-1];
}
发现在统计答案时, d p [ i ] [ j ] dp[i][j] dp[i][j] 只受 d p [ x ] [ j − 1 ] dp[x][j-1] dp[x][j−1]影响,故而可以从这里入手优化代码,类似于背包 D P DP DP的优化,优化后的代码如下:
for(int i=0;i<(1<<n);i++){
f[i]=A[i];
}
for(int i=0;i<n;i++){
for(int j=0;j<(1<<n);j++){
//此处写转移方程
}
}
总结
S O S D P SOS DP SOSDP 的核心在于答案信息的传递只沿着子数和原数间的包含关系,关于这一关系的运用可以成为列出状态转移方程的一大利器,而答案间的包含关系也是非常重要的考虑因素。