D - Josephina and RPG(概率DP)

本文深入解析了概率动态规划(概率DP)算法,通过实例详细介绍了如何利用概率DP解决多轮比赛获胜概率预测的问题。文章首先定义了dp数组,其中dp[i][j]表示在第i轮比赛结束后,剩余比赛使用策略j时,最终获胜的概率。算法从最后一轮比赛开始向前推导,逐步计算每一轮比赛的获胜概率,并通过比较不同策略下的概率来优化选择。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概率dp

dp[i][j] i 存的是进行了几轮比赛
j 存的是剩下的比赛用什么去打
从后面往前面进行,先算出来最后一轮各个点对最后一队获胜的概率,呢么倒数第二组的概率就是任意一个点和倒数第二个点的概率加上 max(倒数第一个的概率和刚才的呢个点或者是倒一点和道二)也就是换没换点,然后合并最后两个点,在此假设只有两个点,以此循环。

例如我算的是 3 4 5 6
我在算5的时候
会把 dp[5][1] ,dp[5][2],dp[5][3],d[5][4],dp[5][5]都算出来
接着到了4 我会看看是 其他点到4的概率在五是不是应该用4,还是其它点。

#include <bits/stdc++.h>
using namespace std;
const int maxn = 10005;
double p[200][200],ans= 0 ;
double dp[maxn][200];
int a[maxn];
int main()
{
    int m;
    while(scanf("%d",&m)!=EOF)
    {
        ans = 0;
        m = m*(m-1)*(m-2)/6;
        for(int i = 0; i < m; i++)
        {
            for(int j = 0; j < m; j++)
            {
                scanf("%lf",&p[i][j]);
            }
        }
        int n ;
        scanf("%d",&n);
        for(int i =0; i < n; i++)
            scanf("%d",&a[i]);
        memset(dp,0,sizeof(dp));
        for(int i = 0; i < m ; i++)
        {
            dp[n-1][i] = p[i][a[n-1]] ;
        }
        for(int i = n-2; i >= 0; i--)
        {
            for(int j = 0; j < m; j++)
            {
                dp[i][j] = max(dp[i][j],p[j][a[i]]*max(dp[i+1][j],dp[i+1][a[i]]));
            }
        }
        for(int i = 0; i < m; i++)
            ans = max(ans,dp[0][i]);
        printf("%.6lf\n",ans);
    }
    return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值