HDU 4487 Maximum Random Walk 概率DP

该博客介绍了如何利用概率动态规划(DP)解决HDU 4487 Maximum Random Walk问题。每一步有向左、向右或原地不动三种选择,求解经过n步后到达过的最右边位置的期望值。通过定义状态转移方程,博主给出了求解这一问题的代码,并成功获得了Accepted的结果,内存消耗17868 KB,运行时间为78 ms。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目大意:

就是现在起点是数轴上坐标为0的位置, 然后每一步都有L的概率向左走一步, R的概率向右走一步, (1 - R- L)的概率站在原地不动, 问经过n步之后到达过的最右边的位置的期望


大致思路:

其实就是一个简单的dp算出各个最右位置的概率, 根据定义就可以求出期望

状态转移方程等见代码注释


代码如下:

Result  :  Accepted     Memory  :  17868 KB     Time  :  78 ms

/*
 * Author: Gatevin
 * Created Time:  2014/12/24 17:50:26
 * File Name: Sora_Kasugano.cpp
 */
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;

int p, k, n;
double L, R;
double dp[101][210][101];

/*
 * 就是一个期望的定义的题吧, 没有什么难点
 * dp[i][j + 100][k]表示走了i步之后, 停留在位置j, 最右到过位置k的概率
 * 0 <= i <= n, -n <= j <= n, 0 <= k <= n
 * 那么有dp[i][j + 100][k] = dp[i - 1][j + 100 + 1][k]*L (j + 1 <= k)
 *                         + dp[i - 1][j + 100 - 1][k]*R (j == k)
 *                         + dp[i - 1][j + 100 - 1][k - 1]*R (j <= k)
 *                         + dp[i - 1][j + 100][k]*(1 - L - R)
 * 初始时dp[0][0 + 100][0] = 1, 其它为0
 * 那么期望就是∑dp[n][i + 100][j]*j (-n <= i <= n, 0 <= j <= n)
 */

int main()
{
    scanf("%d", &p);
    while(p--)
    {
        scanf("%d", &k);
        scanf("%d %lf %lf", &n, &L, &R);
        printf("%d ", k);
        memset(dp, 0, sizeof(dp));
        dp[0][100][0] = 1;
        for(int i = 1; i <= n; i++)
        {
            for(int k = 0; k <= i; k++)
            {
                for(int j = -i; j <= i; j++)
                {
                    if(j + 1 <= k)
                        dp[i][j + 100][k] += dp[i - 1][j + 100 + 1][k]*L;
                    if(j == k && j != -i && k != 0)
                        dp[i][j + 100][k] += dp[i - 1][j + 100 - 1][k - 1]*R;
                    if(j <= k && j != -i)
                        dp[i][j + 100][k] += dp[i - 1][j + 100 - 1][k]*R;
                    dp[i][j + 100][k] += dp[i - 1][j + 100][k]*(1 - R - L);
                }
            }
        }
        double ans = 0;
        for(int i = -n; i <= n; i++)
            for(int j = 0; j <= n; j++)
                ans += dp[n][i + 100][j]*j;
        printf("%.4f\n", ans);
    }
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值