ZOJ 3329 One Person Game (概率DP)

本文详细阐述了一个涉及多面体游戏的数学问题,通过设定动态规划方程来解决投掷次数的期望问题。文章深入探讨了算法实现细节,包括如何通过动态规划方法计算期望值,以及在不同条件下的应用。通过实例分析,读者可以掌握解决类似问题的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:三个多面体,面数分别为K1,K2,K3。每个面标号1,2,...,K。投掷一次,如果是a,b,c,那么把计数器设为0,反之,计数器加上(a + b + c)。如果计数器大于n,游戏结束,反之继续投掷。求投掷次数的期望值。

思路:设dp[x]为从计数器为x时开始投掷,投掷到>n的期望值。

那么方程为dp[x] = 1 + dp[0] / k1 / k2 / k3  + sigma(dp[x + i + j + k]) / k1 / k2 / k3 . (i != a j != b k != c)

这样对于每个i,dp[i] 都会由dp[0] 表示。

开一个数组记录每个dp[i] 中dp[0] 的系数,最后迭代就可解了。


我的代码:

#include<cstdio>
#include<iostream>
#include<cstring>
#include<cmath>
#include<cstdlib>

using namespace std;
const int maxn = 1505;

int n,k1,k2,k3,a,b,c;
double cnt[maxn];
double dp[maxn];

void solve(){
    fill(cnt,cnt+maxn,0);
    fill(dp,dp+maxn,0);

    for(int x = n ; x >= 0 ; x--){
        dp[x] = 1;
        for(int i = 1; i <= k1 ; i++){
            for(int j = 1; j <= k2 ; j++){
                for(int k = 1; k <= k3; k++){
                    if(i == a && j == b && k == c){
                        cnt[x] += 1.0 / k1 / k2 / k3;
                    }else{
                        if(x + i + j + k > n) continue;
                        dp[x] += dp[x + i + j + k] / k1 / k2 / k3;
                        cnt[x] += cnt[x + i + j + k] / k1 / k2 / k3;
                    }
                }
            }
        }

    }

    double res = dp[0] / (1 - cnt[0]);
    printf("%.10f\n",res);
}

int main(){

    int cas;
    scanf("%d",&cas);
    while(cas--){
        scanf("%d%d%d%d%d%d%d",&n,&k1,&k2,&k3,&a,&b,&c);
        solve();
    }
    return 0;
}


内容概要:本文介绍了基于SMA-BP黏菌优化算法优化反向传播神经网络(BP)进行多变量回归预测的项目实例。项目旨在通过SMA优化BP神经网络的权重和阈值,解决BP神经网络易陷入局部最优、收敛速度慢及参数调优困难等问题。SMA算法模拟黏菌寻找食物的行为,具备优秀的全局搜索能力,能有效提高模型的预测准确性和训练效率。项目涵盖了数据预处理、模型设计、算法实现、性能验证等环节,适用于多变量非线性数据的建模和预测。; 适合人群:具备一定机器学习基础,特别是对神经网络和优化算法有一定了解的研发人员、数据科学家和研究人员。; 使用场景及目标:① 提升多变量回归模型的预测准确性,特别是在工业过程控制、金融风险管理等领域;② 加速神经网络训练过程,减少迭代次数和训练时间;③ 提高模型的稳定性和泛化能力,确保模型在不同数据集上均能保持良好表现;④ 推动智能优化算法与深度学习的融合创新,促进多领域复杂数据分析能力的提升。; 其他说明:项目采用Python实现,包含详细的代码示例和注释,便于理解和二次开发。模型架构由数据预处理模块、基于SMA优化的BP神经网络训练模块以及模型预测与评估模块组成,各模块接口清晰,便于扩展和维护。此外,项目还提供了多种评价指标和可视化分析方法,确保实验结果科学可信。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值