ZOJ 3329 One Person Game (概率DP)

题目: LINK

题意:有三个骰子,分别有k1,k2,k3个面。初始分数为0,每次掷骰子,如果三个面分别为a,b,c则分数置0,否则加上三个骰子的分数之和。当分数大于n时结束。
求游戏的期望步数。
设E(i) 为分数为i时 要cast骰子次数的期望。
E(i) = ∑(p[k] * E(i+k)) +p0 * E[0]; // p[k] 为一次中三个骰子和为k的概率, p0 为掷出(a, b, c)的概率
可以看出E(i) 都和E(0) 有关
可以设: E(i) = X[i] * E(0) + Y[i]; 
把上面两个式子 结合,可以得到
E(i) = ∑(p[k] * ( X[i+k] * E(0) + Y[i+k])  ) +p0 * E[0] 
则   X[i] = ∑(p[k] *  X[i+k]) + p0
    Y[i] = ∑(p[k] * Y[i+k]) + 1
处理边界,i>n时X[i], Y[i]为0,之后递推即可

#include <cstdio>
#include <cstring>
#include <algorithm>
#include <iostream>
#include <string>
#include <vector>
#include <cmath>
#include <queue>
#include <map>
#include <set>
using namespace std; 
#define INF 1000000000
//typedef __int64 LL; 
#define N 1111
int t, n, k1, k2, k3, a, b, c; 
double X[666], Y[666], p[100]; 
int main() {
#ifndef ONLINE_JUDGE
    freopen("in.txt", "r", stdin); 
#endif // ONLINE_JUDGE
    scanf("%d", &t); 
    while(t--) {
        scanf("%d%d%d%d%d%d%d", &n, &k1, &k2, &k3, &a, &b, &c); 
        memset(p, 0, sizeof(p)); 
        double p0 = 1.0/k1/k2/k3; 
        for(int i = 1; i <= k1; i++) {
            for(int j = 1; j <= k2; j++) {
                for(int k = 1; k <= k3; k++) {
                    if(i != a || j != b || k != c) p[i+j+k] += p0; 
                }
            }
        }
        memset(X, 0, sizeof(X)); memset(Y, 0, sizeof(Y)); 
        for(int i = n; i >= 0; i--) {
            X[i] = p0; Y[i] = 1.0; 
            for(int j = 1; j <= k1 + k2 + k3; j++) {
                X[i] += p[j] * X[i+j]; 
                Y[i] += p[j] * Y[i+j]; 
            }
        }
        printf("%.13lf\n", Y[0] / (1 - X[0])); 
    }
    return 0; 
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值