gym102994G. Blackjack Moscow Pre-Finals Workshop 2020 - Legilimens+Coffee Chicken Contest

博客介绍了如何使用动态规划解决一类概率计算问题,具体涉及在有限张牌中选择一定数量,使得总和落在特定区间内的概率。通过设置dp数组和转移状态,计算每一步的选择概率,并最终求得满足条件的概率值。

https://codeforces.com/gym/102994/problem/G

学习自https://blog.youkuaiyun.com/Irving0323/article/details/115291600

赛中想的是前i张牌选的牌之和为j的dp,然后枚举下一张牌在哪个位置插入,然而怎么转移都发现会有重复的,或者其他问题。。。

题解告诉我们设dp[i][j][k]为考虑前i张牌选了j张牌总和为k的概率,那么概率肯定就是 ( j! ) / (n*(n-1)*...(n-j+1)),也就是前j张牌是任意排列的,然后因为前j个位置第一个位置是n种选择,第j个位置就有(n-j+1)种选择,所以把他们乘起来,其实本质就是选j张的总方案数有A(n,j), 选择出这j张的概率是 1/A(n,j)

然后在计算答案的时候我们枚举哪一张牌是作为最后一次选中,让总和恰好在(a,b]之间的,把这些加进答案就行了。

那么就需要算出tmp[j][k]为考虑了所有n张牌后,选了j张,总和是k,但是这j张一定不包含第i张的概率,这是个经典套路,“消失的背包” 叉姐很多年前出过的

#include<bits/stdc++.h>
using namespace std;

const int maxl=510;

int n,a,b;double ans;
int x[maxl];
double dp[2][maxl][maxl];
double tmp[maxl][maxl];

inline void prework()
{
	scanf("%d%d%d",&n,&a,&b);
	for(int i=1;i<=n;i++)
		scanf("%d",&x[i]);
}

inline void mainwork()
{
	dp[0][0][0]=1.0;
	int c=0;
	for(int i=1;i<=n;i++)
	{
		c^=1;
		for(int j=0;j<=i;j++)
			for(int k=0;k<=b;k++)
			{
				dp[c][j][k]=dp[c^1][j][k];
				if(j>=1 && k>=x[i])
					dp[c][j][k]+=dp[c^1][j-1][k-x[i]]*j/(n-j+1);
			}
	}
	ans=0;
	for(int i=1;i<=n;i++)
	{
		for(int j=0;j<n;j++)
			for(int k=0;k<=b;k++)
			{
				tmp[j][k]=dp[c][j][k];
				if(j>=1 && k>=x[i])
					tmp[j][k]-=tmp[j-1][k-x[i]]*j/(n+1-j);
			}
		for(int j=0;j<n;j++)
			for(int k=0;k<=b;k++)
			if(k>a-x[i] && k<=b-x[i] && k<=a)
				ans+=tmp[j][k]/(n-j);
	}
}

inline void print()
{
	printf("%.8f\n",ans);
}

int main()
{
	prework();
	mainwork();
	print();
	return 0;
}

 

在使用 Isaac Gym 时,出现 `'cannot pickle'` 错误通常是因为尝试将 Isaac Gym 的 `Gym` 对象传递给需要序列化的组件,例如多进程(`multiprocessing`)或 Ray 框架中的远程函数。错误信息 `'cannot pickle 'isaacgym._bindings.linux-x86_64.gym_38.Gym' object'` 表示 Python 的 `pickle` 模块无法序列化 `Gym` 对象,因为 Isaac Gym 的底层绑定没有实现序列化支持 [^1]。 ### 常见原因及解决方案 #### 1. **避免直接传递 Gym 对象** - **问题**:将 `gym` 实例直接传递给多进程函数或 Ray 任务时,会尝试对 `Gym` 对象进行序列化,从而引发错误。 - **解决方案**:确保在子进程中重新创建 `gym` 实例,而不是从主进程传递过来。例如,在每个进程中初始化 Isaac Gym 环境。 ```python import isaacgym import multiprocessing as mp def worker_process(): import gym gym_instance = gym.make('Isaac-BoxStacking-v0') # 示例环境 env = gym_instance.env # 执行环境操作 obs = env.reset() print(obs) if __name__ == '__main__': processes = [] for _ in range(4): p = mp.Process(target=worker_process) p.start() processes.append(p) for p in processes: p.join() ``` #### 2. **使用共享内存或通信机制** - **问题**:在分布式训练中,例如使用 Ray 时,可能需要共享 Gym 环境。 - **解决方案**:将 Gym 环境封装在 Ray 的 `Actor` 中,每个 Actor 管理自己的环境实例,避免直接传递 `Gym` 对象。 ```python import ray import isaacgym import gym ray.init() @ray.remote class GymActor: def __init__(self): self.env = gym.make('Isaac-BoxStacking-v0').env def reset(self): return self.env.reset() def step(self, action): return self.env.step(action) # 创建多个远程 Actor actors = [GymActor.remote() for _ in range(4)] # 并行执行环境 results = [actor.reset.remote() for actor in actors] print(ray.get(results)) ``` #### 3. **使用 `cloudpickle` 替代默认的 `pickle`** - **问题**:某些框架(如 Ray)默认使用 `pickle` 进行序列化,而 `pickle` 对复杂对象的支持有限。 - **解决方案**:配置 Ray 使用 `cloudpickle`,它对复杂对象的支持更好,但仍然不能保证完全解决 Isaac Gym 对象的序列化问题。因此,仍建议使用 `Actor` 模式或重新创建 `gym` 实例。 ```bash pip install cloudpickle ``` ```python import ray import cloudpickle ray.init() @ray.remote(serializer=cloudpickle.dumps, deserializer=cloudpickle.loads) def my_remote_function(): import gym gym_instance = gym.make('Isaac-BoxStacking-v0') env = gym_instance.env return env.reset() result = ray.get(my_remote_function.remote()) print(result) ``` #### 4. **确保环境隔离** - **问题**:某些情况下,环境对象可能被多个线程或进程共享,导致不可预测的错误。 - **解决方案**:确保每个线程或进程都有独立的 `gym` 实例,避免共享底层资源。 ### 总结 解决 Isaac Gym 中 `'cannot pickle'` 错误的关键在于避免直接序列化 `Gym` 对象。可以通过在每个进程中重新创建 `gym` 实例、使用 Ray 的 `Actor` 模型、或采用共享内存机制来实现。此外,尽量避免跨进程共享 Isaac Gym 的环境对象,以确保程序的稳定性和可扩展性 。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值