BZOJ-1419: Red is good (期望DP)

最新推荐文章于 2018-09-01 13:27:00 发布

转载最新推荐文章于 2018-09-01 13:27:00 发布 · 86 阅读

0 ·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/keximeiruguo/p/7728734.html

探讨了在桌面有R张红牌和B张黑牌的情况下，通过制定最优策略来最大化获得的金钱值。玩家翻牌时，红牌得1美元，黑牌失1美元，可随时停止。介绍了使用动态规划算法求解此问题的方法。

1419: Red is good

Time Limit: 10 Sec Memory Limit: 64 MB
Submit: 1018 Solved: 463
[Submit][Status][Discuss]

Description

桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

HINT

输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

Source

哇呀呀呀呀laj没想到用滚动数组存期望=_=

f[i][j]表示选了i个红j个黑

 1 #include "bits/stdc++.h"
 2 using namespace std;
 3 typedef long long LL;
 4 typedef double D;
 5 const int MAX=5005;
 6 int n,m;
 7 double f[2][MAX];
 8 inline double mx(D x,D y){return x>y?x:y;}
 9 int main(){
10     freopen ("card.in","r",stdin);freopen ("card.out","w",stdout);
11     int i,j;
12     scanf("%d%d",&n,&m);
13     for (i=0;i<=n;i++){
14         f[i%2][0]=i;
15         for (j=1;j<=m;j++){
16             f[i%2][j]=mx( 0.0 , i*1.0/( (i+j)*1.0 )*( f[(i+1)%2][j]+1.0 ) + j*1.0/( (i+j)*1.0 )*( f[i%2][j-1]-1.0 ) );
17         }
18     }
19     LL ans=f[n%2][m]*1e6;
20     printf("%lf",ans*1.0/1e6);
21     return 0;
22 }

转载于:https://www.cnblogs.com/keximeiruguo/p/7728734.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34220834

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

BZOJ 1419: Red is good（期望DP）

Ab.Ever

03-21

371

题目描述权限传送门题解比较水的期望DP，但也让我悟到了一点关于期望的东西。题目描述得不可描述，看起来逼格很高。但平均就是期望，关键是最优策略这点。根据我幼稚的理解，期望是均值没错，但期望之所以叫期望是因为它在预知未来，当前这个状态期望的得分就是作出决策后未来能得到分数的均值。所以或许这就是期望DP的状态要倒过来推的原因吧。考虑f[i][j]为剩下i张红牌j张黑牌的在最优策略下的期望。根据我脚推的式子

BZOJ-1588: [HNOI2002]营业额统计（set查找前驱后继 splay练习题）

hmc0411的博客

10-18

1037

splay一道模板题，联系简单的插入删除寻找前驱后继的操作。题意：4e4天，每天有一个营业额，找到当天之前营业额与当天营业额差值最小的一天，然后累加这个差值。

参与评论您还未登录，请先登录后发表或查看评论

BZOJ1419: Red is good

weixin_30809173的博客

08-21

151

1419: Red is good Time Limit: 10 SecMemory Limit: 64 MBSubmit: 639Solved: 247[Submit][Status][Discuss] Description 桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到...

[BZOJ1419] Red is good

LPA的博客

03-27

328

Description 桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。 Input 一行输入两个数R,B,其值在0到5000之间 Output 在最优策略下平均能得到多少钱。 Sample Input 5 1 Sample Output 4.166666 ...

【bzoj1419】Red is good 期望dp

Oxer的专栏

05-10

1554

f[i][j]表示有i张红j张黑情况下的期望收益 f[i][j]=max(0,i/(i+j)*(f[i-1][j]+1)+j/(i+j)*(f[i][j-1]-1)) 转移是和很好理解的，如果选了的期望收益注： 1、直接开数组会爆内存，所以要用滚动数组 2、注意不要四舍五入 #include #include #include #include #include #inc

【BZOJ1419】Red is good

cz_xuyixuan的博客

03-20

305

【题目链接】点击打开链接【思路要点】补档博客，无题解。【代码】#include<bits/stdc++.h> using namespace std; #define MAXN 5005 double f[2][MAXN]; int n, m; int main() { scanf("%d%d", &n, &m); for (int i = 1; i <= n...

【BZOJ】【P1419】【Red is good】【题解】【DP】

退役狗的专栏

02-01

1470

传送门:http://www.lydsy.com/JudgeOnline/problem.php?id=1419 仰慕wyfcyx Code: #include using namespace std; double f[2][5010]; int n,m,cur; int main(){ cin>>n>>m; for(int i=1;i<=n;i++){ f[cur][0]=i;

contests-all-in-one:BZOJ，POJ，LeetCode，USACO，HDUOJ，LA的比赛解决方案

03-15

BZOJ，POJ，LeetCode，USACO，HDUOJ，LA的比赛解决方案有话要说嗨，我是Ex10si0n。该存储库用于记录我的OJ AC代码。关于我 OIer，Develpoer。希望这个仓库可以帮助那些通过Probelm ID找到LeetCode或其他OJ解决...

wangjunrui666#bzoj-problem##3255. 一个关于序列的游戏1

07-25

第一行一个整数N，表示序列长度第二行N个数，V1、V2VN，代表每个长度对应的分数第三行N个数，A1、A2AN，代表初始序列的每个元素

wangjunrui666#bzoj-problem##2704. 旅游1

07-25

1. 保证[1,1]格不是障碍 2. 除[1,1]格外不能重复走过同一格 3. [1,1]格的快乐程度只算一次 4. 快

BZOJ1419——Red is good(期望dp)

weixin_30363817的博客

09-01

113

题头描述桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。输入一行输入两个数R,B,其值在0到5000之间输出在最优策略下平均能得到多少钱。样例输入 5 1 样例输出 ...

Red is good (DP)

hehepig的博客

03-20

734

题目 Problem Description 桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。输出答案时,小数点后第六位后的全部去掉,不要四舍五入. Input 一行输入两个数R,B,其值在0到5000之间 Ou

bzoj 1419: Red is good （概率与期望）

clover_hxy的博客

11-15

520

1419: Red is good Time Limit: 10 Sec Memory Limit: 64 MB Submit: 696 Solved: 279 [Submit][Status][Discuss] Description 桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平

bzoj 1419: Red is good

heheda_is_an_OIer的博客

05-10

672

f[i][j]表示有i个R,j个B的期望，然后转移。注意输出多位小数下取整，小数点之后要06lld ll ans=floor(f[now][B]*1000000); printf("%lld.%06lld\n",ans/1000000,ans%1000000); #include#include#include#include#include#define ll long

bzoj1419: Red is good

agtvo48266的专栏

06-13

124

题目链接 bzoj1419: Red is good 题解由于有决策存在,所以要满足最有子结构，而期望正是能用来表示改状态的好坏继续翻牌期望<0莫不如不取设dp[i,j]表示有i张+1，j张-1的牌 dp[i,j]=max(0,(dp[i-1,j]+1)\frac{i}{i +j} + (dp[i,j-1]-1)\frac{j}{i+j}) dp[i,0]=i; 随便滚掉一维...

【期望DP】BZOJ1419[Red is good]题解

ZigZagK的博客

11-10

491

题目概述有 AA 张红牌， BB 张黑牌。现在将 A+BA+B 张牌打乱，每次翻牌。翻到红牌得到一元钱，翻到黑牌失去一元钱。可以随时停止翻牌，求在最优策略下得到钱数的期望。解题报告期望DP通用套路，倒着来。定义 f[i][j]f[i][j] 表示剩下 ii 张红牌， jj 张黑牌得到钱数的期望。那么 f[i][j]=ii+jf[i−1][j]+ji+jf[i][j−1]f[i][j]=\frac{i

【BZOJ】1419 Red is Good

Pure_W的博客

03-21

427

【BZOJ】1419 Red is Good 大意：桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱直接期望DP f[i][j]表示开一局i红j黑的游戏的期望收益，然后f[i][j]可以由f[i-1][j]和f[i][j-1]转移要滚动

BZOJ 1419: Red is good【期望

Flaze_的博客

11-21

524

看了眼数据范围……n^2啊……不怂了似乎要炸空间？滚一下可以随时终止的话每个状态和0取个max就好 f[i][j]表示i个红j个黑的期望收益，显然可以通过算下一个拿的是红还是黑来转移代码： #include #define MAXN 5005 using namespace std; int n,m; long double f[2][MAXN]; int main(){ s

BZOJ1419：Red is good（期望DP）

DZYO的博客

10-24

400

传送门桌面上有R张红牌和B张黑牌，随机打乱顺序后放在桌面上，开始一张一张地翻牌，翻到红牌得到1美元，黑牌则付出1美元。可以随时停止翻牌，在最优策略下平均能得到多少钱。概率DP是真的难。。首先想到期望DP: f[Red][Blue]=RedRead+Blue∗(f[Red−1][Blue]+1)+BlueRed+Blue∗(f[Red][Blue−1]−1)f[Red][Blue]= \fr

BZOJ练习题集：P4001至P4406

标题中提到的“BZOJ第四部分”是指在线评测系统BZOJ（Beijing Zhongguancun Online Judge）的一个特定集系列的题目。BZOJ是一个面向信息学竞赛（如NOI、NOIP等）选手的在线题库系统，它提供了大量的算法和编程题目供...