hdu3853

本文介绍了一道关于迷宫行走的期望DP问题及其解决方法。文章详细解释了如何使用期望DP来计算从起点到终点所需的平均魔法值,并通过具体代码示例展示了实现过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:有一个r*c的迷宫,题目给出“原地不动”,“朝右走”,“朝下走”的概率。每走一步需要消耗2个魔法值。问从(0,0)开始走到(r,c)位置需要多少魔法值

题目分析:一看就是一道期望dp,需要用的就是公式。水题。

dp[i][j]记录的就是到点(i,j)的期望值。

1.期望dp

期望dp通常逆推,即从结果推向初始状态,也可以用记忆化搜索进行dp;

E=Σp1*(E1+X1)+Σp2*(E+X2)

其中E为当前状态的期望,E1为下一个状态的期望,p1和X1分别为将当前状态转移到下一个状态的概率和花费,p2和X2分别为保持当前状态的概率和花费。

最后化简为E=(Σp1*(E1+X1)+Σp2*X2)/(1-Σp2)


代码如下:

#include<iostream>
#include<string.h>
#include<stdio.h>
#include<cmath>
#include<algorithm>
using namespace std;
double dp[1005][1005],gailv[1005][1005][3];
int main()
{
    int r,c;
    while(~scanf("%d%d",&r,&c))
    {
        memset(dp,0,sizeof(dp));
        for(int i=1;i<=r;r++)
        {
            for(int j=1;j<=c;j++)
            {
                for(int k=0;k<3;k++)
                {
                    scanf("%lf",&gailv[i][j][k]);
                }
            }
        }
        for(int i=r;i>0;i--){
            for(int j=c;j>0;j--){
                if(i==r&&j==c)
                    continue;
                if(fabs(1-gailv[i][j][0])<1e-7)
                    continue;
                dp[i][j]=(gailv[i][j][1]*dp[i][j+1]+gailv[i][j][2]*dp[i+1][j]+2)/(1-gailv[i][j][0]);
            }
        }
        printf("%.3f",dp[1][1]);
    }
    return 0;
}

感觉一篇文章对公式的解读比较好:

我们知道概率的  E(i)=p1+p2+p3......+pn;
    对于E(ax+bk)=a*Ex+b*Ek;
我们不妨从(r,c)出发:
        首先要明确的是: 在没有到达(r,c)之前,是不能停留的。所以
         dp[1][1]=dp[1][2]*mat[1][1][3]+dp[2][1]*mat[1][1][2];
         dp[1][1]=dp[1][1]/(1-map[1][1][0])   //除去停下来的其他概率,得到期望    
依次这样推:
        dp[i][j]=dp[i][j+1]*mat[i][j][3]+dp[i+1][j]*mat[i][j][2];
         dp[i][j]=dp[i][j]/(1-map[i][j][0])   //除去停下来的其他概率,得到期望  
但是由于这样从(1,1)推断,会出现将不收敛问题;


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值