礼物 期望dp

季堂计划为夏川挑选生日礼物以最大化其喜悦值。通过分析不同礼物带来的喜悦值及获取概率,运用状态压缩动态规划算法,计算期望的购买次数与最大喜悦值。

Description

夏川的生日就要到了。作为夏川形式上的男朋友,季堂打算给夏川买一些生日礼物。 
商店里一共有种礼物。夏川每得到一种礼物,就会获得相应喜悦值Wi(每种礼物的喜悦值不能重复获得)。 
每次,店员会按照一定的概率Pi(或者不拿出礼物),将第i种礼物拿出来。季堂每次都会将店员拿出来的礼物买下来。 
众所周知,白毛切开都是黑的。所以季堂希望最后夏川的喜悦值尽可能地高。 
求夏川最后最大的喜悦值是多少,并求出使夏川得到这个喜悦值,季堂的期望购买次数。

Input

第一行,一个整数N,表示有N种礼物。 
接下来N行,每行一个实数Pi和正整数Wi,表示第i种礼物被拿出来的概率和可以获得喜悦值。

Output

第一行,一个整数表示可以获得的最大喜悦值。 
第二行,一个实数表示获得这个喜悦值的期望购买次数,保留3位小数。

Sample Input


0.1 2 
0.2 5 
0.3 7

Sample Output

14 
12.167

Data Constraint

对于10%的数据,N = 1 
对于30%的数据,N ≤ 5 
对于100%的数据,N ≤ 20 ,0 < Wi ≤ 10^9 ,0 < Pi ≤ 1且∑Pi ≤ 1 
注意:本题不设spj

Solution

看N大小,显然状压DP 
转移方程 

Fs=F[s]Pi+(1Pi)+1(s=s+2i)

当然,这样是比较奇怪的,所以移项 
PiFs=Fspi

接着移项 
Fs=FspiPi


上面的那个是正推,倒退是一样的,是指f数组的含义改变了,f【i】表示从i这个状态到目标状态的期望步数,显然f [ (1 < < n) - 1 ]=0,f [ 0 ]  就是所求答案。
吐槽:总感觉期望的题倒退比顺推简单
正推:
#include<cstdio>
#include<algorithm>
#define fo(i,a,b) for(int i=a;i<=b;i++)
using namespace std;
int n;
double f[1048576],p[21];
int main()
{
    scanf("%d",&n);long long an=0,jy;
    fo(i,1,n) scanf("%lf %lld",&p[i],&jy),an+=jy;
    printf("%lld\n",an);
    fo(s,1,(1<<n)-1)
    {
        double sig=0;f[s]=0;
        fo(i,1,n) if(s & (1<<i-1)) f[s]=f[s]+f[s-(1<<i-1)]*p[i],sig=sig+p[i];
        f[s]=(f[s]+1)/sig;
    }
    printf("%.3lf",f[(1<<n)-1]);
}

逆推:
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std ;

#define N 2000000 + 10
typedef long long ll ;

double f[N] , P[N] ;
int n , m ;
ll ans ;

int main() {
	//freopen( "gift.in" , "r" , stdin ) ;
	//freopen( "gift.out" , "w" , stdout ) ;
	scanf( "%d" , &n ) ;
	for (int i = 1 ; i <= n ; i ++ ) {
		int a ;
		scanf( "%lf%d" , &P[i] , &a ) ;
		if ( P[i] > 0 ) ans += a ;
	}
	m = (1 << n) - 1 ;
	f[m] = 0 ;
	for (int s = m - 1 ; s >= 0 ; s -- ) {
		double sum = 0 ;
		for (int j = 0 ; j < n ; j ++ ) {
			if ( (s & (1 << j)) == 0 ) {
				sum += P[j+1] ;
				int _s = s | (1 << j) ;
				f[s] += P[j+1] * f[_s] ;
			}
		}
		f[s] ++ ;
		f[s] = f[s] / sum ;
	}
	printf( "%lld\n%.3lf\n" , ans , f[0] ) ;
	return 0 ;
}

### 蓝桥杯竞赛中的期望动态规划(Expectation DP) #### 什么是期望动态规划? 期望动态规划是一种特殊的动态规划形式,通常用于解决概率和统计相关的问题。其核心在于通过状态转移方程计算某个事件发生的期望值。这类问题的特点是存在多种可能的状态变化路径,并且每种路径都有一定的概率发生。 在蓝桥杯竞赛中,期望动态规划题目往往涉及随机过程、决策优化以及条件概率等内容。以下是针对此类问题的一些通用解题思路: --- #### 解题思路 1. **定义状态** 定义清晰的状态变量 \( dp[i] \),表示当前处于某种状态下所对应的期望值或最优值。例如,在某些问题中,\( dp[i] \) 可能代表从第 \( i \) 步到目标状态的期望步数[^4]。 2. **建立状态转移方程** 根据问题描述,分析如何从前一状态转移到下一状态。对于期望动态规划而言,状态转移方程一般会涉及到加权平均的形式,即考虑不同分支的概率及其对应的结果。例如: \[ dp[i] = p_1 \cdot f(dp[j]) + p_2 \cdot g(dp[k]) \] 其中 \( p_1, p_2 \) 是相应分支的发生概率,而 \( f(\cdot), g(\cdot) \) 表示具体的转换逻辑[^5]。 3. **初始化边界条件** 明确初始状态下的期望值或者已知结果。这一步非常重要,因为它是整个递推的基础。例如,如果到达终点时的期望值为零,则可以直接设置 \( dp[n] = 0 \)[^6]。 4. **逆向思考** 很多时候,正向求解可能会遇到循环依赖等问题,因此采用倒序的方式更容易实现。比如先从最终状态出发逐步向前更新各个中间节点的数据[^7]。 5. **注意精度控制** 鉴于浮点运算容易引发误差累积现象,在编写程序过程中应特别留意数值处理细节,必要情况下可适当调整比较阈值来规避潜在风险[^8]。 --- #### 示例代码 下面给出一个简单的例子——掷骰子游戏,假设每次投掷六面均匀骰子直到累计得分达到指定分数为止,问所需的平均次数是多少? ```cpp #include <bits/stdc++.h> using namespace std; const int MAX_SCORE = 1e5; double dp[MAX_SCORE + 1]; // 存储每个得分为i时还需要多少次才能完成任务 int main(){ memset(dp, 0, sizeof(dp)); int target_score; cin >> target_score; for(int s=target_score-1 ;s>=0;s--){ double sum_prob=0,sum_expect=0; for(int roll=1;roll<=6 && (s+roll)<=target_score;roll++){ sum_prob += 1/6.0; sum_expect += ((dp[s+roll]+1)*1/6.0); } if(sum_prob>0){ dp[s]=sum_expect / sum_prob; }else{ dp[s]=(double)(MAX_SCORE*10); // 设置极大值作为不可达标志 } } printf("%.9f\n",dp[0]); } ``` 上述代码片段展示了如何运用DP表记录各阶段所需预期操作数目并据此得出全局解决方案的过程[^9]。 --- #### 注意事项 尽管以上方法适用于大多数常规场景,但在实际比赛中还需灵活应对各种特殊情况。例如当面临复杂约束条件或是非线性关系时,单纯依靠基础模型或许难以满足需求,此时则需引入更多高级算法加以辅助[^10]。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值