2022HDU#3 1 期望dp+分治NTT

本文探讨了如何使用期望动态规划解决装备升级问题,通过计算升级到n级的期望花费,涉及概率、成本递推和卷积递推式,展示了如何利用分治法求解并给出C++代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题意:

有一个装备,初始是0级,在 i i i级时可以花费 c i c_{i} ci元来尝试升级装备一次,有 p i p_{i} pi的概率升级到 i + 1 i+1 i+1级,有 ( 1 − p i ) w j ∑ k = 1 i w k \frac{(1-p_{i})w_{j}}{\sum_{k=1}^{i}w_{k}} k=1iwk(1pi)wj的概率降级到 i − j i-j ij级,求升级到 n n n级的期望花费。

方法:

很明显的期望 d p dp dp,设 f i f_{i} fi为当前等级为 i i i,升级到 n n n级的期望花费为 f i f_{i} fi,并且以前缀和的形式记 s u m i = ∑ j = 1 i w k sum_{i}=\sum_{j=1}^{i}w_{k} sumi=j=1iwk,期望表达式: f i = p i ( c i + f i + 1 ) + ∑ j = 1 i 1 − p i s u m i w j ( c i + f i − j ) f_{i}=p_{i}(c_{i}+f_{i+1})+\sum_{j=1}^{i}\frac{1-p_{i}}{sum_{i}}w_{j}(c_{i}+f_{i-j}) fi=pi(ci+fi+1)+j=1isumi1piwj(ci+fij)

化简即: f i = p i f i + 1 + c i + 1 − p i s u m i ∑ j = 1 i w j f i − j f_{i}=p_{i}f_{i+1}+c_{i}+\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}f_{i-j} fi=pifi+1+ci+sumi1pij=1iwjfij

原式形式 i i i有前面 i i i项与 i + 1 i+1 i+1得来,不太方便计算,于是变形,将 f i + 1 f_{i+1} fi+1写在前面,使得 i + 1 i+1 i+1都由前面推出:

f i + 1 = f i − c i − 1 − p i s u m i ∑ j = 1 i w j f i − j p i f_{i+1}=\frac{f_{i}-c_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}f_{i-j}}{p_{i}} fi+1=pificisumi1pij=1iwjfij

虽然最后一项是卷积形式,但是并不知道 f f f任何一项是多少,令 f i = a i f 0 + b i f_{i}=a_{i}f_{0}+b_{i} fi=aif0+bi,有 a 0 = 1 , b 0 = 0 a_{0}=1,b_{0}=0 a0=1b0=0

有: a i + 1 f 0 + b i + 1 = a i f 0 − c i − 1 − p i s u m i ∑ j = 1 i w j ( a i − j f 0 + b i − j ) p i a_{i+1}f_{0}+b_{i+1}=\frac{a_{i}f_{0}-c_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}(a_{i-jf_{0}+b_{i-j}})}{p_{i}} ai+1f0+bi+1=piaif0cisumi1pij=1iwj(aijf0+bij)

我们将右式以带不带 f 0 f_{0} f0为准则分开,则这个方程的一个解就是左侧带 f 0 f_{0} f0的项与右边带 f 0 f_{0} f0的项相等,左侧不带 f 0 f_{0} f0的与右侧不带 f 0 f_{0} f0的相等,并且将带 f 0 f_{0} f0的那个解的左右两边的 f 0 f_{0} f0约去,得到:

a i + 1 = a i − 1 − p i s u m i ∑ j = 1 i w j a i − j p i a_{i+1}=\frac{a_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}a_{i-j}}{p_{i}} ai+1=piaisumi1pij=1iwjaij

b i + 1 = b i − c i − 1 − p i s u m i ∑ j = 1 i w j b i − j p i b_{i+1}=\frac{b_{i}-c_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}b_{i-j}}{p_{i}} bi+1=pibicisumi1pij=1iwjbij

这是一个卷积递推式,可以用分治 n t t ntt ntt求解,计算的方法是(以 a a a为例子):求 a i + 1 a_{i+1} ai+1时, [ 0 , i − 1 ] [0,i-1] [0,i1] a a a是已知的,用已知的 a a a来卷积得到 ∑ j = 1 i w j a i − j \sum_{j=1}^{i}w_{j}a_{i-j} j=1iwjaij

,然后分治到 l = = r l==r l==r时利用已知的 a a a b b b和求出来的 ∑ j = 1 i w j a i − j \sum_{j=1}^{i}w_{j}a_{i-j} j=1iwjaij来递推 a i + 1 a_{i+1} ai+1

求解完后,利用 f n = a n f 0 + b n = 0 ⇒ f 0 = − b n a n f_n=a_nf_0+b_n=0\Rightarrow f_0=-\frac{b_n}{a_{n}} fn=anf0+bn=0f0=anbn求解即可

#include<bits/stdc++.h>
#define ll long long
using namespace std;

int read()
{
	int ret=0,base=1;
	char ch=getchar();
	while(!isdigit(ch))
	{
		if(ch=='-') base=-1;
		ch=getchar();
	}
	while(isdigit(ch))
	{
		ret=(ret<<3)+(ret<<1)+ch-48;
		ch=getchar();
	}
	return ret*base;
}

const long long mod=998244353,inv3=332748118,inv100=828542813;

ll qpow(ll a,ll b)
{
	ll ret=1,base=a;
	while(b)
	{
		if(b&1) ret=ret*base%mod;
		base=base*base%mod;
		b>>=1;
	}
	return ret;
}

int getlen(int k)
{
	int ret=0;
	while(k){ret++;k>>=1;}
	return ret;
}

int getrev(int k,int len)
{
	int ret=0;
	while(k){ret=ret<<1|(k&1);k>>=1;len--;}
	while(len--) ret<<=1;
	return ret;
}

int n,pos[270005];

void ntt(ll* a,int limit,int op)
{
	for(int i=0;i<limit;i++){
		if(i<pos[i]) swap(a[i],a[pos[i]]);
	}
	for(int len=2;len<=limit;len<<=1)
	{
		ll base=qpow(op==1?3:inv3,(mod-1)/len);
		for(int l=0;l<limit;l+=len)
		{
			ll now=1;
			for(int i=l;i<l+len/2;i++)
			{
				ll temp1=a[i],temp2=now*a[i+len/2]%mod;
				a[i]=(temp1+temp2)%mod;
				a[i+len/2]=(temp1-temp2+mod)%mod;
				now=now*base%mod;
			}
		}
	}
}

void multi(ll *a,ll *b,ll *tog,int limit)
{
	//a*tog,b*tog
	int len=getlen(limit-1);
	for(int i=0;i<limit;i++) pos[i]=(pos[i>>1]>>1)|((i&1)<<(len-1)); 
	ntt(a,limit,1);ntt(b,limit,1);ntt(tog,limit,1);
	for(int i=0;i<limit;i++)
	{
		a[i]=a[i]*tog[i]%mod;
		b[i]=b[i]*tog[i]%mod;
	}
	ntt(a,limit,-1);ntt(b,limit,-1);
	ll temp=qpow(limit,mod-2);
	for(int i=0;i<limit;i++)
	{
		a[i]=a[i]*temp%mod;
		b[i]=b[i]*temp%mod;
	}
}

ll p[270005],c[270005],w[270005],sum[270005],ans_a[270005],ans_b[270005];
ll f[270005],g[270005],a[270005],b[270005],tog[270005];

void solve(int l,int r)
{
	//a,b,tog是卷积容器
	//f,g是卷积结果
	//ans_a,ans_b是公式中的a,b
	if(l==r)
	{
		//用已知的ans_a与ans_b和卷积结果f和g递推i+1
		ans_a[l+1]=((ans_a[l]-(1ll-p[l])*sum[l]%mod*f[l]%mod)%mod+mod)*qpow(p[l],mod-2)%mod;
		ans_b[l+1]=((ans_b[l]-c[l]-(1ll-p[l])*sum[l]%mod*g[l]%mod)%mod+mod)*qpow(p[l],mod-2)%mod;
		return;
	}
	int mid=l+r>>1;
	solve(l,mid);
	for(int i=l;i<=mid;i++)
	{
		a[i-l]=ans_a[i];
		b[i-l]=ans_b[i];
	}
	for(int i=mid+1;i<=r;i++) a[i-l]=b[i-l]=0;
	for(int i=l;i<=r;i++) tog[i-l]=w[i-l];
	multi(a,b,tog,r-l+1);
	for(int i=mid+1;i<=r;i++)
	{
		f[i]=(f[i]+a[i-l])%mod;
		g[i]=(g[i]+b[i-l])%mod;
	}
	solve(mid+1,r);
}

void work()
{
	n=read();
	for(int i=0;i<n;i++)
	{
		p[i]=read()*inv100%mod;
		c[i]=read();
	}
	for(int i=1;i<n;i++)
	{
		w[i]=read();
		sum[i]=(sum[i-1]+w[i])%mod;
	}
	int limit=1;
	while(limit<=n) limit<<=1;
	for(int i=0;i<=n;i++) f[i]=g[i]=tog[i]=ans_a[i]=ans_b[i]=0;
	for(int i=1;i<n;i++) sum[i]=qpow(sum[i],mod-2);//由于sum都在分母出现,所以可以以逆元形式存储
	ans_a[0]=1;ans_b[0]=0;//已知的初始项
	solve(0,limit-1);
	ll ans=(-ans_b[n])*qpow(ans_a[n],mod-2)%mod;
	printf("%lld\n",(ans+mod)%mod);
}

int main()
{
	int t=read();
	while(t--) work();
 	return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值