SCOI2008 奖励关

洛谷传送门

期望DP,用记忆化搜索实现。看到15这种小数据,就应该立刻想到状态压缩。
f f f数组记录期望。现在已选的宝藏状态为 n o w now now,现在要选第 t t t个宝藏,那么 f [ n o w ] [ t ] f[now][t] f[now][t]表示这时的期望。

为了避免一些非法的情况,考虑倒推。对于记忆化搜索来说,就是一个回溯的过程。
如果当前状态为 n o w now now,现在决定第 t t t个宝藏,枚举到一个宝藏 i i i,而当前 n o w now now又满足可以取到 i i i,那么就在取和不取之间求 m a x max max,对应代码就是:
f [ n o w ] [ t ] + = m a x ( ( d p ( n o w ∣ 2 i − 1 , t + 1 ) + v a l [ i ] ) / n , d p ( n o w , t + 1 ) / n ) ; f[now][t]+=max((dp(now|2^{i-1},t+1)+val[i])/n,dp(now,t+1)/n); f[now][t]+=max((dp(now2i1,t+1)+val[i])/n,dp(now,t+1)/n);

再解释一下——
取的话,就是(走这一步的情况的期望(递归求解) + + +当前宝藏的贡献) × \times ×(走到当前情况的概率)
不取的话,就是(走这一步的情况的期望(递归求解)) × \times ×(走到当前情况的概率)
由于期望的线性性,加起来就好了。

注意一下,虽然 n &lt; = 15 n&lt;=15 n<=15,但是 k &lt; = 100 k&lt;=100 k<=100 f f f数组要开够。。。

代码如下:

#include<bits/stdc++.h>
using namespace std;
const int maxn=105;
const int maxm=1<<16;
int need[maxn],k;
bool vis[maxm][maxn];
double f[maxm][maxn],val[maxn],n;
inline int read(){
	int f=1,x=0;char ch=getchar();
	while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
	while(isdigit(ch)) x=(x<<3)+(x<<1)+ch-'0',ch=getchar();
	return x*f;
}
//now表示现在状态    t表示正在选第几轮 
//t>k时,已经不合法了,返回0就好了。
inline double dp(int now,int t){
	if(t>k) return 0;
	if(vis[now][t]) return f[now][t];
	f[now][t]=0,vis[now][t]=1;
	for(int i=1;i<=n;++i){
		if((now&need[i])==need[i])
		f[now][t]+=max((dp(now|(1<<(i-1)),t+1)+val[i])/n,dp(now,t+1)/n);
		else f[now][t]+=dp(now,t+1)/n;
	}return f[now][t];
}
int main(){
	scanf("%d%lf",&k,&n);
	for(int i=1;i<=n;++i){
		val[i]=(double)read();
		while(int d=read()) need[i]|=1<<(d-1);
	}printf("%.6lf",dp(0,1));
}
中描述了一个幼儿园里分配糖果的问题,每个小朋友都有自己的要求。问题的输入包括两个整数NN和KK,表示幼儿园里的小朋友数量和要满足的要求数量。接下来的KK行表示小朋友们的要求,每行有三个数字,XX,AA,BB。如果X=1,表示第AA个小朋友分到的糖果必须和第BB个小朋友分到的糖果一样多;如果X=2,表示第AA个小朋友分到的糖果必须少于第BB个小朋友分到的糖果;如果X=3,表示第AA个小朋友分到的糖果必须不少于第BB个小朋友分到的糖果;如果X=4,表示第AA个小朋友分到的糖果必须多于第BB个小朋友分到的糖果;如果X=5,表示第AA个小朋友分到的糖果必须不多于第BB个小朋友分到的糖果。这个问题可以被看作是一个差分约束系统的问题。 具体地说,可以使用差分约束系统来解决这个问题。差分约束系统是一种通过给变量之间的系添加约束来求解最优解的方法。对于这个问题,我们需要根据小朋友们的要求建立约束条件,并通过解决这个约束系统来得出最小的糖果数量。 在问题的输入中,X的取值范围为1到5,分别对应不同的系约束。根据这些约束,我们可以构建一个差分约束图。图中的节点表示小朋友,边表示糖果数量的系。根据不同的X值,我们可以添加相应的边和权重。然后,我们可以使用SPFA算法(Shortest Path Faster Algorithm)来求解这个差分约束系统,找到满足所有约束的最小糖果数量。 需要注意的是,在读取输入时需要判断X和Y是否合法,即是否满足X≠Y。如果X=Y,则直接输出-1,因为这种情况下无法满足约束条件。 综上所述,为了满足每个小朋友的要求,并且满足所有的约束条件,我们可以使用差分约束系统和SPFA算法来求解这个问题。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [【差分约束系统】【SCOI2011】糖果 candy](https://blog.youkuaiyun.com/jiangzh7/article/details/8872699)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [P3275 [SCOI2011]糖果(差分约束板子)](https://blog.youkuaiyun.com/qq_40619297/article/details/88678605)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值