DP——2008 APAC local onsites C Millionaire

本文介绍了一个赌博游戏的最优策略概率计算方法。通过分析一轮游戏的情况并应用动态规划算法,求解了在限定轮数内资金达到指定数额的概率。具体算法包括确定概率分布的关键点,并逐步迭代更新概率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 题目链接:
    https://codejam.withgoogle.com/codejam/contest/32005/dashboard#s=p2

  • 题意:在一个赌博游戏中,初始有X元,总共玩M轮,每次你可以下一定赌注,有概率P赢:赌注翻倍;输:赌注就没了。求在M轮后总金额达到1000000以上的概率。(假设采取最优策略)

  • 分析:经分析,我们发现如果只有一轮的话,根据初始赌注的不同,最后达到目的的概率为 [0~50000]: 0, [500000~1000000]: P, [1000000~﹢∞): 1。即只需找出分界点的概率。在计算的时候,我们则假设一个赌注然后取 max(p[ix](1P)+p[i+x]P) 。然后我们发现这个分界点的数目为 2M+1 ,然后搜索每个点的概率即可

  • DP:

void solve(int t)
{
    int n = 1<<M;
    double *prv = dp[0], *nxt = dp[1];
    memset(prv, 0, sizeof(double)*(n+1));
    prv[n] = 1.0;
    for(int i=0;i<M;i++)
    {
        for(int j=0;j<=n;j++)
        {
            int gap = min(j, n-j);
            double cnt = 0.0;
            for(int k=0;k<=gap;k++)
            {
                cnt = max(cnt, (1-P)*prv[j-k]+(P)*prv[j+k]);
            }
            nxt[j] = cnt;
        }
        swap(prv,nxt);
    }
    int index = (LL)X*n/1000000;
    printf("Case #%d: %.6lf\n", t, prv[index]);
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值