HDU 4050 wolf5x 概率DP

题目大意:

就是现在起点在数轴上的原点x = 0处, 现在前进的的规则位置1到n中第i个位置被初始化为状态j的概率是p[i][j]如果j = 1表示位置i只能用左脚踏入, 如果 j = 2表示只能右脚踏入, 如果j = 3表示任意方式踏入, j = 0不能踏入, 现在对于位置i初始化为以上4种状态的概率的和都是1.

如果当前在位置i, 每次可以选择前进A~B格, 当多个位置Si可走的时候选择最小的Si前进, 当没有前进的选择或者走到x > n的位置时停止前进,, 问从x = 0出发到停止前进的步数的期望


大致思路:

很简单的概率DP问题, 状态转移方程见代码注释部分


代码如下:

Result  :  Accepted     Memory  :  1372 KB     Time  :  140 ms

/*
 * Author: Gatevin
 * Created Time:  2014/12/25 10:20:59
 * File Name: Sora_Kasugano.cpp
 */
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;

double p[4001][4];
double dp[4001][4];

/*
 * dp[i][j]表示当前是以状态j踏入的位置i, 到达目标所需要的期望步数
 * 那么当j == 3时 dp[i][j] = ∑((∑(dp[i + k][l] + 1)*p[i + k][l])*P(位置i + A, i + A + 1,...i + k - 1都取不能走的概率))
 * A <= k <= B, 1 <= l <= 3;
 *       j == 3时, 位置i + A, i + A + 1...i + k - 1不能走的概率是p[i + A][0]*p[i + A + 1][0]*...*p[i + k - 1][0]
 * 求和即可 对于j == 2, 1时后继状态中l 不能取2, 位置i + A, i + A + 1,... i + k - 1不能取的概率是
 * (p[i + A][0] + p[i + A][2])*(p[i + A + 1][0] + p[i + A + 1][2])*...*(p[i + k - 1][0] + p[i + k - 1][2]);
 * 对于j == 1, l 不能取1,  位置i + A, i + A + 1,... i + k - 1不能取的概率是
 * (p[i + A][0] + p[i + A][1])*(p[i + A + 1][0] + p[i + A + 1][1])*...*(p[i + k - 1][0] + p[i + k - 1][1]);
 * 初始时对于i > n dp[i][1,2,3] = 0;
 * 最后dp[0][3]即是答案
 * 注意初始化p[i > n][3]为1
 */

int main()
{
    int t, n, A, B;
    scanf("%d", &t);
    while(t--)
    {
        scanf(" %d %d %d", &n, &A, &B);
        memset(p, 0, sizeof(p));
        for(int i = 1; i <= n; i++)
            for(int j = 0; j < 4; j++)
                scanf("%lf", &p[i][j]);
        for(int i = n + 1; i <= n + B; i++) p[i][3] = 1;//大于n的位置可以任意方式踏入
        memset(dp, 0, sizeof(dp));
        for(int i = n; i >= 0; i--)
        {
            double tmp = 1;
            for(int k = A; k <= B; k++)
            {
                dp[i][3] += ((dp[i + k][1] + 1)*p[i + k][1] + (dp[i + k][2] + 1)*p[i + k][2] + (dp[i + k][3] + 1)*p[i + k][3])*tmp;
                tmp *= p[i + k][0];
            }
            tmp = 1;
            for(int k = A; k <= B; k++)
            {
                dp[i][2] += ((dp[i + k][1] + 1)*p[i + k][1] + (dp[i + k][3] + 1)*p[i + k][3])*tmp;
                tmp *= (p[i + k][0] + p[i + k][2]);
            }
            tmp = 1;
            for(int k = A; k <= B; k++)
            {
                dp[i][1] += ((dp[i + k][2] + 1)*p[i + k][2] + (dp[i + k][3] + 1)*p[i + k][3])*tmp;
                tmp *= (p[i + k][0] + p[i + k][1]);
            }
        }
        printf("%.6f\n", dp[0][3]);        
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值