题目大意:
就是现在起点在数轴上的原点x = 0处, 现在前进的的规则位置1到n中第i个位置被初始化为状态j的概率是p[i][j]如果j = 1表示位置i只能用左脚踏入, 如果 j = 2表示只能右脚踏入, 如果j = 3表示任意方式踏入, j = 0不能踏入, 现在对于位置i初始化为以上4种状态的概率的和都是1.
如果当前在位置i, 每次可以选择前进A~B格, 当多个位置Si可走的时候选择最小的Si前进, 当没有前进的选择或者走到x > n的位置时停止前进,, 问从x = 0出发到停止前进的步数的期望
大致思路:
很简单的概率DP问题, 状态转移方程见代码注释部分
代码如下:
Result : Accepted Memory : 1372 KB Time : 140 ms
/*
* Author: Gatevin
* Created Time: 2014/12/25 10:20:59
* File Name: Sora_Kasugano.cpp
*/
#include<iostream>
#include<sstream>
#include<fstream>
#include<vector>
#include<list>
#include<deque>
#include<queue>
#include<stack>
#include<map>
#include<set>
#include<bitset>
#include<algorithm>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cctype>
#include<cmath>
#include<ctime>
#include<iomanip>
using namespace std;
const double eps(1e-8);
typedef long long lint;
double p[4001][4];
double dp[4001][4];
/*
* dp[i][j]表示当前是以状态j踏入的位置i, 到达目标所需要的期望步数
* 那么当j == 3时 dp[i][j] = ∑((∑(dp[i + k][l] + 1)*p[i + k][l])*P(位置i + A, i + A + 1,...i + k - 1都取不能走的概率))
* A <= k <= B, 1 <= l <= 3;
* j == 3时, 位置i + A, i + A + 1...i + k - 1不能走的概率是p[i + A][0]*p[i + A + 1][0]*...*p[i + k - 1][0]
* 求和即可 对于j == 2, 1时后继状态中l 不能取2, 位置i + A, i + A + 1,... i + k - 1不能取的概率是
* (p[i + A][0] + p[i + A][2])*(p[i + A + 1][0] + p[i + A + 1][2])*...*(p[i + k - 1][0] + p[i + k - 1][2]);
* 对于j == 1, l 不能取1, 位置i + A, i + A + 1,... i + k - 1不能取的概率是
* (p[i + A][0] + p[i + A][1])*(p[i + A + 1][0] + p[i + A + 1][1])*...*(p[i + k - 1][0] + p[i + k - 1][1]);
* 初始时对于i > n dp[i][1,2,3] = 0;
* 最后dp[0][3]即是答案
* 注意初始化p[i > n][3]为1
*/
int main()
{
int t, n, A, B;
scanf("%d", &t);
while(t--)
{
scanf(" %d %d %d", &n, &A, &B);
memset(p, 0, sizeof(p));
for(int i = 1; i <= n; i++)
for(int j = 0; j < 4; j++)
scanf("%lf", &p[i][j]);
for(int i = n + 1; i <= n + B; i++) p[i][3] = 1;//大于n的位置可以任意方式踏入
memset(dp, 0, sizeof(dp));
for(int i = n; i >= 0; i--)
{
double tmp = 1;
for(int k = A; k <= B; k++)
{
dp[i][3] += ((dp[i + k][1] + 1)*p[i + k][1] + (dp[i + k][2] + 1)*p[i + k][2] + (dp[i + k][3] + 1)*p[i + k][3])*tmp;
tmp *= p[i + k][0];
}
tmp = 1;
for(int k = A; k <= B; k++)
{
dp[i][2] += ((dp[i + k][1] + 1)*p[i + k][1] + (dp[i + k][3] + 1)*p[i + k][3])*tmp;
tmp *= (p[i + k][0] + p[i + k][2]);
}
tmp = 1;
for(int k = A; k <= B; k++)
{
dp[i][1] += ((dp[i + k][2] + 1)*p[i + k][2] + (dp[i + k][3] + 1)*p[i + k][3])*tmp;
tmp *= (p[i + k][0] + p[i + k][1]);
}
}
printf("%.6f\n", dp[0][3]);
}
return 0;
}