Newcoder 147 C.Gambling(概率DP+组合数学)

本文探讨了一种在一系列比赛中,如何根据当前比赛结果调整赌注,以确保最终收益与一次性下注相等的策略。通过计算不同比赛结果下的胜率变化,提出了一种基于概率的动态投注方法。

Description

两个队AAABBB要比赛2n−12n-12n1场比赛,哪支队伍先胜利nnn场则获胜,牛牛想压2n−12^{n-1}2n1元在AAA队,如果AAA队最终获胜则赚了2n−12^{n-1}2n1,否则赔了2n−12^{n-1}2n1. 但是赛方不允许这样赌球,牛牛只能对每场比赛单独赌,假设两支队伍每场比赛各自获胜的概率均为0.50.50.5,牛牛每次在看完第iii场比赛后赌一些钱压第i+1i+1i+1场比赛AAA队胜,输入nnn和每场比赛的结果,每输入一场比赛的结果则要输出牛牛对下一场比赛赌的钱数,使得分开nnn次赌的结果和之前一次赌球的结果相同

Input

输入nnn个每场比赛的结果,111表示AAA胜,000表示BBB胜,000111数量达到nnn则不再输入,比赛结束

(1≤n≤105)(1\le n\le 10^5)(1n105)

Output

输入nnn后则要输出牛牛在第一场比赛压的钱,输入第iii场比赛的结果后则要输出牛牛在下一场比赛压的钱,最终需要保证牛牛压的总钱数为2n−12^{n-1}2n1,且赌球结果和一次赌的结果相同,每次的钱数模109+710^9+7109+7后输出

Sample Input

2
0 1 1

Sample Output

4
4
8

Solution

关键在于求出之前AAA已经胜xxx场,BBB已经胜yyy场后AAA的胜率,以f[x][y]f[x][y]f[x][y]表示该状态AAA的胜率,之后z=2n−1−x−yz=2n-1-x-yz=2n1xy场比赛AAA至少要胜利n−xn-xnx场才能取得胜利,故有
f[x][y]=12z∑k=n−xzCzk f[x][y]=\frac{1}{2^z}\sum\limits_{k=n-x}^{z}C_z^k f[x][y]=2z1k=nxzCzk
进而可以得到转移f[n][y]=1,f[x][n]=0,f[x][y]=12(f[x+1][y]+f[x][y+1])f[n][y]=1,f[x][n]=0,f[x][y]=\frac{1}{2}(f[x+1][y]+f[x][y+1])f[n][y]=1,f[x][n]=0,f[x][y]=21(f[x+1][y]+f[x][y+1])

这意味着f[x+1][y]−f[x][y]=f[x][y]−f[x][y+1]f[x+1][y]-f[x][y]=f[x][y]-f[x][y+1]f[x+1][y]f[x][y]=f[x][y]f[x][y+1],即第x+y+1x+y+1x+y+1场比赛结束后,AAA胜利造成的胜率增值等于AAA失败造成的胜率减少值,假设胜率的变化值为ppp,那么当前应该投注2p⋅22n−12p\cdot 2^{2n-1}2p22n1,只要求出ppp即可,而
p=12(f[x+1][y]−f[x][y+1])=12z−1∑k=n−x−1z−1Cz−1k−12z−1∑k=n−xz−1Cz−1k=12z−1Cz−1n−x−1 p=\frac{1}{2}(f[x+1][y]-f[x][y+1])=\frac{1}{2^{z-1}}\sum\limits_{k=n-x-1}^{z-1}C_{z-1}^k-\frac{1}{2^{z-1}}\sum\limits_{k=n-x}^{z-1}C_{z-1}^k=\frac{1}{2^{z-1}}C_{z-1}^{n-x-1} p=21(f[x+1][y]f[x][y+1])=2z11k=nx1z1Cz1k2z11k=nxz1Cz1k=2z11Cz1nx1
故应投注22n−122n−2−x−yC2n−2−x−yn−1−x=2x+y+1C2n−2−x−yn−1−x\frac{2^{2n-1}}{2^{2n-2-x-y}}C_{2n-2-x-y}^{n-1-x}=2^{x+y+1}C_{2n-2-x-y}^{n-1-x}22n2xy22n1C2n2xyn1x=2x+y+1C2n2xyn1x,预处理阶乘以及逆元还有222的次幂,时间复杂度O(n)O(n)O(n)

Code

#include<cstdio>
using namespace std;
typedef long long ll;
#define maxn 200005
#define mod 1000000007
int mul(int x,int y)
{
	ll z=1ll*x*y;
	return z-z/mod*mod;
}
int add(int x,int y)
{
	x+=y;
	if(x>=mod)x-=mod;
	return x;
}
int inv[maxn],fact[maxn],b[maxn];
void init(int n=2e5)
{
	inv[1]=1;
	for(int i=2;i<=n;i++)inv[i]=mul(mod-mod/i,inv[mod%i]);
	inv[0]=1;
	for(int i=1;i<=n;i++)inv[i]=mul(inv[i-1],inv[i]);
	fact[0]=1;
	for(int i=1;i<=n;i++)fact[i]=mul(i,fact[i-1]);
	b[0]=1;
	for(int i=1;i<=n;i++)b[i]=add(b[i-1],b[i-1]);
}
int C(int n,int m)
{
	return mul(fact[n],mul(inv[m],inv[n-m]));
}
int n,x,y;
int Solve()
{
	return mul(b[x+y+1],C(2*n-2-x-y,n-x-1));
}
int main()
{
	init();
	scanf("%d",&n);
	x=0,y=0;
	while(x<n&&y<n)
	{
		printf("%d\n",Solve());
		int temp;
		scanf("%d",&temp);
		if(temp)x++;
		else y++;
	}
	return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值