zoj 3822(概率dp)

本文介绍了解决ZOJ3822问题的一种动态规划方法,该问题要求计算在一个n*m的棋盘上,每天放置一颗棋子直到每行每列都至少有一颗棋子的期望天数。通过构建三维DP数组,递推计算得到最终的期望值。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

/*
    zoj 3822
    题目大意是
    有一个n*m大小的棋盘
    每天放一颗棋子
    问使得这个棋盘每行每列都有一颗棋子的期望


    解题思路大体是
    建立一个三维的dp数组dp[i][j][k]
    表示放第k颗棋子使得,棋盘有i行j列有棋子的概率


    我们可以考虑这个概率的组成
    这个概率肯定是由只放了k-1颗棋子时的概率组成
    我们可以考虑k-1颗棋子有哪些情况
    1.最简单的,本来就是i行j列有棋子概率是dp[i][j][k-1]
      那么它会变成dp[i][j][k]的概率是需要在这i行j列的网格里面放一颗棋子的概率
      也就是i*j减去已经被占的格子k再+1(以下+1的原因相同,应该很好想)得出可以摆的格子数
      除以整个棋盘还能摆的格子数,即n*m-k+1。
      写成式子为(i*j-k+1)/(n*m-k+1)
    2.本来是i-1行有棋子,但是摆的这颗棋子所在的这一列本来就有棋子,
      也就是说,这颗棋子增加了一行但是没有增加一列。这个的概率是dp[i-1][j][k-1]
      使其变成dp[i][j][k]的概率是,需要在每摆棋子的那些行,也就是n-(i-1)行,以及已经摆棋子的那j列
      摆放一颗棋子,所以可以摆放的格子数是(n-(i-1))*j,总共还可以摆放的格子是n*m-k+1
      写成式子为(n-i+1)*j/(n*m-k+1)
    3.本来是j-1列有棋子,但是摆的这颗棋子所在的这一行本来就有棋子,与2同理
      写成式子为(m-j+1)*i/(n*m-k+1)
    4.本来i-1行有棋子,且j-1有棋子,其概率为dp[i][j][k-1]
      那么它会变成dp[i][j][k]的概率是摆放一颗棋子不在这i-1行,j-1列
      即所符合要求的格子数为(n-i+1)*(m-j+1),总格子数依旧为(n*m-k+1)
      写成式子为(n-i+1)*(m-j+1)/(n*m-k+1)
    综上所述
    dp[i][j][k]=(dp[i-1][j][k-1]*(n-i+1)*j+dp[i][j-1][k-1]*(m-j+1)*i+dp[i-1][j-1][k-1]*(n-i+1)*(m-j+1)+dp[i][j][k-1]*(i*j-k+1))/(n*m-k+1)


    然后有一个特殊情况是
    当我们求dp[n][m][k]时,不会存在dp[n][m][k-1]这种情况
    因为若摆k-1颗棋子时是dp[n][m][k-1]这种情况那么,已经符合要求,我们不需要再摆放
    所以此时式子将变成
    dp[i][j][k]=(dp[i-1][j][k-1]*(n-i+1)*j+dp[i][j-1][k-1]*(m-j+1)*i+dp[i-1][j-1][k-1]*(n-i+1)*(m-j+1))/(n*m-k+1)
    特判一下即可


    最后写个循环求期望
    期望=概率*颗数(一天一颗,也可以说是天数)
*/
#include <iostream>
#include <cmath>
#include <string.h>
#include <stdio.h>
#define ll long long
using namespace std;


double dp[55][55][2510];
int main()
{
    int t;
    scanf("%d",&t);
    while(t--)
    {
        int n,m;
        scanf("%d%d",&n,&m);
        dp[0][0][0]=1.0;
        int s=n*m;
        for(int i=1;i<=n;i++)
        {
            for(int j=1;j<=m;j++)
            {
                for(int k=1;k<=s;k++)
                {
                    if(i==n&&j==m)
                        dp[i][j][k]=(dp[i-1][j][k-1]*(n-i+1)*j+dp[i][j-1][k-1]*(m-j+1)*i+dp[i-1][j-1][k-1]*(n-i+1)*(m-j+1))/(s-k+1);
                    else
                        dp[i][j][k]=(dp[i-1][j][k-1]*(n-i+1)*j+dp[i][j-1][k-1]*(m-j+1)*i+dp[i-1][j-1][k-1]*(n-i+1)*(m-j+1)+dp[i][j][k-1]*(i*j-k+1))/(s-k+1);
                }
            }
        }
        double ans=0;
        for(int i=1;i<=s;i++)
        {
            ans+=dp[n][m][i]*i;
        }
        printf("%.12lf\n",ans);
    }
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值