oj_470 Red is good

本文介绍了一个关于翻牌游戏的博弈论问题,玩家面对桌面随机排列的红牌和黑牌,通过数学期望的方法求解最优策略下的平均收益,并提供了一段使用C++实现的代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目描述

Problem 470: Red is good
Time Limit: 1000 ms
Memory Limit: 524288 KB

Problem Description

桌面上有R张红牌和B张黑牌,随机打乱顺序后放在桌面上,开始一张一张地翻牌,翻到红牌得到1美元,黑牌则付出1美元。可以随时停止翻牌,在最优策略下平均能得到多少钱。 输出答案时,小数点后第六位后的全部去掉,不要四舍五入.

Input

一行输入两个数R,B,其值在0到5000之间

Output

在最优策略下平均能得到多少钱。

Sample Input

5 1

Sample Output

4.166666

题解

概率期望

和的期望==期望的和
输出答案时,小数点后第六位后的全部去掉,不要四舍五入.
可以用滚动数组

所以
f【i】【j】表示剩余i个red,j个black的期望值
滚动后f【j】表示剩余j个black的期望值
因为期望值为负时,还不如break
所以f[j]=max(f[j],(double)0);
最后要注意精度问题
f【m】=f【m】-0.0000005

代码

#include<cstdio>
#include<iostream>
#include<cmath>
#define N 5010
using namespace std;
double f[N];
int n,m;
int main(){
    scanf("%d%d",&n,&m);
    for(int i=0;i<=n;i++){
        for(int j=0;j<=m;j++){
            if(i>0)f[j]=((double)i/(double)(i+j))*(f[j]+1); //转移
            if(j>0)f[j]+=((double)j/(double)(i+j))*(f[j-1]-1);
            f[j]=max(f[j],(double)0);
        }
    }
    printf("%.6f\n",f[m]-0.0000005);
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值