BZOJ 1419 Red is good 期望DP

最新推荐文章于 2018-04-26 11:24:59 发布

原创最新推荐文章于 2018-04-26 11:24:59 发布 · 1.5k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#BZOJ #BZOJ1419 #期望DP

BZOJ 同时被 2 个专栏收录

667 篇文章

订阅专栏

期望DP

14 篇文章

订阅专栏

本文探讨了在给定数量的红牌和黑牌中，通过最优策略实现收益最大化的数学模型和算法。重点介绍了如何在翻牌过程中决策以最大化预期收益。

题目大意：有R张红牌和B张黑牌打乱扣在桌子上，一张一张翻，可以随时停止翻牌，翻到红牌收益+1，翻到黑牌收益-1，求最优策略下的最大期望收益

OTZ wfycyx= = http://wyfcyx.is-programmer.com/posts/74629.html

#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
#define M 5050
using namespace std;
int r,b;
double f[2][M];
int main()
{
	int i,j;
	cin>>r>>b;
	for(i=0;i<=r;i++)
		for(j=0;j<=b;j++)
		{
			if(!i) f[i&1][j]=0;
			else if(!j) f[i&1][j]=i;
			else f[i&1][j]=max(0.0,(double)i/(i+j)*(f[~i&1][j]+1)+(double)j/(i+j)*(f[i&1][j-1]-1));
		}
	printf("%.6lf\n",f[r&1][b]-5e-7);
	return 0;
}