2022HDU#3 1 期望dp+分治NTT

本文探讨了如何使用期望动态规划解决装备升级问题,通过计算升级到n级的期望花费,涉及概率、成本递推和卷积递推式,展示了如何利用分治法求解并给出C++代码实现。
题意:

有一个装备,初始是0级,在iii级时可以花费cic_{i}ci元来尝试升级装备一次,有pip_{i}pi的概率升级到i+1i+1i+1级,有(1−pi)wj∑k=1iwk\frac{(1-p_{i})w_{j}}{\sum_{k=1}^{i}w_{k}}k=1iwk(1pi)wj的概率降级到i−ji-jij级,求升级到nnn级的期望花费。

方法:

很明显的期望dpdpdp,设fif_{i}fi为当前等级为iii,升级到nnn级的期望花费为fif_{i}fi,并且以前缀和的形式记sumi=∑j=1iwksum_{i}=\sum_{j=1}^{i}w_{k}sumi=j=1iwk,期望表达式:fi=pi(ci+fi+1)+∑j=1i1−pisumiwj(ci+fi−j)f_{i}=p_{i}(c_{i}+f_{i+1})+\sum_{j=1}^{i}\frac{1-p_{i}}{sum_{i}}w_{j}(c_{i}+f_{i-j})fi=pi(ci+fi+1)+j=1isumi1piwj(ci+fij)

化简即:fi=pifi+1+ci+1−pisumi∑j=1iwjfi−jf_{i}=p_{i}f_{i+1}+c_{i}+\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}f_{i-j}fi=pifi+1+ci+sumi1pij=1iwjfij

原式形式iii有前面iii项与i+1i+1i+1得来,不太方便计算,于是变形,将fi+1f_{i+1}fi+1写在前面,使得i+1i+1i+1都由前面推出:

fi+1=fi−ci−1−pisumi∑j=1iwjfi−jpif_{i+1}=\frac{f_{i}-c_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}f_{i-j}}{p_{i}}fi+1=pificisumi1pij=1iwjfij

虽然最后一项是卷积形式,但是并不知道fff任何一项是多少,令fi=aif0+bif_{i}=a_{i}f_{0}+b_{i}fi=aif0+bi,有a0=1,b0=0a_{0}=1,b_{0}=0a0=1b0=0

有:ai+1f0+bi+1=aif0−ci−1−pisumi∑j=1iwj(ai−jf0+bi−j)pia_{i+1}f_{0}+b_{i+1}=\frac{a_{i}f_{0}-c_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}(a_{i-jf_{0}+b_{i-j}})}{p_{i}}ai+1f0+bi+1=piaif0cisumi1pij=1iwj(aijf0+bij)

我们将右式以带不带f0f_{0}f0为准则分开,则这个方程的一个解就是左侧带f0f_{0}f0的项与右边带f0f_{0}f0的项相等,左侧不带f0f_{0}f0的与右侧不带f0f_{0}f0的相等,并且将带f0f_{0}f0的那个解的左右两边的f0f_{0}f0约去,得到:

ai+1=ai−1−pisumi∑j=1iwjai−jpia_{i+1}=\frac{a_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}a_{i-j}}{p_{i}}ai+1=piaisumi1pij=1iwjaij

bi+1=bi−ci−1−pisumi∑j=1iwjbi−jpib_{i+1}=\frac{b_{i}-c_{i}-\frac{1-p_{i}}{sum_{i}}\sum_{j=1}^{i}w_{j}b_{i-j}}{p_{i}}bi+1=pibicisumi1pij=1iwjbij

这是一个卷积递推式,可以用分治nttnttntt求解,计算的方法是(以aaa为例子):求ai+1a_{i+1}ai+1时,[0,i−1][0,i-1][0,i1]aaa是已知的,用已知的aaa来卷积得到∑j=1iwjai−j\sum_{j=1}^{i}w_{j}a_{i-j}j=1iwjaij

,然后分治到l==rl==rl==r时利用已知的aaabbb和求出来的∑j=1iwjai−j\sum_{j=1}^{i}w_{j}a_{i-j}j=1iwjaij来递推ai+1a_{i+1}ai+1

求解完后,利用fn=anf0+bn=0⇒f0=−bnanf_n=a_nf_0+b_n=0\Rightarrow f_0=-\frac{b_n}{a_{n}}fn=anf0+bn=0f0=anbn求解即可

#include<bits/stdc++.h>
#define ll long long
using namespace std;

int read()
{
	int ret=0,base=1;
	char ch=getchar();
	while(!isdigit(ch))
	{
		if(ch=='-') base=-1;
		ch=getchar();
	}
	while(isdigit(ch))
	{
		ret=(ret<<3)+(ret<<1)+ch-48;
		ch=getchar();
	}
	return ret*base;
}

const long long mod=998244353,inv3=332748118,inv100=828542813;

ll qpow(ll a,ll b)
{
	ll ret=1,base=a;
	while(b)
	{
		if(b&1) ret=ret*base%mod;
		base=base*base%mod;
		b>>=1;
	}
	return ret;
}

int getlen(int k)
{
	int ret=0;
	while(k){ret++;k>>=1;}
	return ret;
}

int getrev(int k,int len)
{
	int ret=0;
	while(k){ret=ret<<1|(k&1);k>>=1;len--;}
	while(len--) ret<<=1;
	return ret;
}

int n,pos[270005];

void ntt(ll* a,int limit,int op)
{
	for(int i=0;i<limit;i++){
		if(i<pos[i]) swap(a[i],a[pos[i]]);
	}
	for(int len=2;len<=limit;len<<=1)
	{
		ll base=qpow(op==1?3:inv3,(mod-1)/len);
		for(int l=0;l<limit;l+=len)
		{
			ll now=1;
			for(int i=l;i<l+len/2;i++)
			{
				ll temp1=a[i],temp2=now*a[i+len/2]%mod;
				a[i]=(temp1+temp2)%mod;
				a[i+len/2]=(temp1-temp2+mod)%mod;
				now=now*base%mod;
			}
		}
	}
}

void multi(ll *a,ll *b,ll *tog,int limit)
{
	//a*tog,b*tog
	int len=getlen(limit-1);
	for(int i=0;i<limit;i++) pos[i]=(pos[i>>1]>>1)|((i&1)<<(len-1)); 
	ntt(a,limit,1);ntt(b,limit,1);ntt(tog,limit,1);
	for(int i=0;i<limit;i++)
	{
		a[i]=a[i]*tog[i]%mod;
		b[i]=b[i]*tog[i]%mod;
	}
	ntt(a,limit,-1);ntt(b,limit,-1);
	ll temp=qpow(limit,mod-2);
	for(int i=0;i<limit;i++)
	{
		a[i]=a[i]*temp%mod;
		b[i]=b[i]*temp%mod;
	}
}

ll p[270005],c[270005],w[270005],sum[270005],ans_a[270005],ans_b[270005];
ll f[270005],g[270005],a[270005],b[270005],tog[270005];

void solve(int l,int r)
{
	//a,b,tog是卷积容器
	//f,g是卷积结果
	//ans_a,ans_b是公式中的a,b
	if(l==r)
	{
		//用已知的ans_a与ans_b和卷积结果f和g递推i+1
		ans_a[l+1]=((ans_a[l]-(1ll-p[l])*sum[l]%mod*f[l]%mod)%mod+mod)*qpow(p[l],mod-2)%mod;
		ans_b[l+1]=((ans_b[l]-c[l]-(1ll-p[l])*sum[l]%mod*g[l]%mod)%mod+mod)*qpow(p[l],mod-2)%mod;
		return;
	}
	int mid=l+r>>1;
	solve(l,mid);
	for(int i=l;i<=mid;i++)
	{
		a[i-l]=ans_a[i];
		b[i-l]=ans_b[i];
	}
	for(int i=mid+1;i<=r;i++) a[i-l]=b[i-l]=0;
	for(int i=l;i<=r;i++) tog[i-l]=w[i-l];
	multi(a,b,tog,r-l+1);
	for(int i=mid+1;i<=r;i++)
	{
		f[i]=(f[i]+a[i-l])%mod;
		g[i]=(g[i]+b[i-l])%mod;
	}
	solve(mid+1,r);
}

void work()
{
	n=read();
	for(int i=0;i<n;i++)
	{
		p[i]=read()*inv100%mod;
		c[i]=read();
	}
	for(int i=1;i<n;i++)
	{
		w[i]=read();
		sum[i]=(sum[i-1]+w[i])%mod;
	}
	int limit=1;
	while(limit<=n) limit<<=1;
	for(int i=0;i<=n;i++) f[i]=g[i]=tog[i]=ans_a[i]=ans_b[i]=0;
	for(int i=1;i<n;i++) sum[i]=qpow(sum[i],mod-2);//由于sum都在分母出现,所以可以以逆元形式存储
	ans_a[0]=1;ans_b[0]=0;//已知的初始项
	solve(0,limit-1);
	ll ans=(-ans_b[n])*qpow(ans_a[n],mod-2)%mod;
	printf("%lld\n",(ans+mod)%mod);
}

int main()
{
	int t=read();
	while(t--) work();
 	return 0;
}


评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值