GYM 101550 F.Fleecing the Raffle(概率)

本文介绍了一种通过向抽奖盒中添加卡片来最大化中奖概率的方法。详细分析了如何通过数学推导找到最佳的卡片数量,并给出了具体的实现代码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Description

一个抽奖盒里有nn个写着不同人的名字的卡片,你可以往其中放任意张写着自己名字的卡片,然后会从抽奖盒里不放回的取出p张卡片,如果这pp张卡片中恰有一张写有你的名字的卡片视为中奖,问中奖的最大概率

Input

两个整数n,p(1pn106)

Output

输出中奖的最大概率

Sample Input

3 2

Sample Output

0.6

Solution

假设放了aa张卡片,那么中奖概率p(a)=Cnp1Ca1Cn+ap=apnp+1i=1anp+in+i

考虑p(a)p(a)p(a+1)p(a+1)的大小关系,p(a+1)p(a)=p(p1)np+1i=1anp+in+i(anp+1p1)p(a+1)−p(a)=p(p−1)n−p+1∏i=1an−p+in+i(a−n−p+1p−1)

故当anp+1p1a≤⌊n−p+1p−1⌋时有p(a+1)p(a)p(a+1)≥p(a),否则p(a)p(a+1)p(a)≥p(a+1),故当a=np+1p1+1=np1a=⌊n−p+1p−1⌋+1=⌊np−1⌋p(a)p(a)最大

Code

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<vector>
#include<queue>
#include<map>
#include<set>
#include<ctime>
using namespace std;
typedef long long ll;
typedef pair<int,int>P;
const int INF=0x3f3f3f3f,maxn=100001;
#define eps 1e-8
double Solve(int n,int p,int a)
{
    double ans=1;
    for(int i=1;i<=a;i++)ans=ans*(n+i-p)/(n+i);
    ans=ans*a*p/(n-p+1);
    return ans;
}
int main()
{
    int n,p;
    while(~scanf("%d%d",&n,&p))
    {
        int a=n/(p-1);
        double ans=Solve(n,p,a);
        printf("%.10f\n",ans);
    }
    return 0;
}
### 使用 `gym.spaces.Box` 定义动作空间 在OpenAI Gym环境中定义连续的动作空间通常会使用到 `gym.spaces.Box` 类。此类允许创建一个多维的盒子形状的空间,其边界由低限(low)和高限(high)参数指定[^1]。 对于给定的例子,在类 `ActionSpace` 中静态方法 `from_type` 返回了一个基于输入类型的行动空间实例: 当 `space_type` 是 `Continuous` 时,返回的是一个三维向量形式的动作空间对象,该对象表示三个维度上的取值范围分别为 `[0.0, 1.0]`, `[0.0, 1.0]`, 和 `[-1.0, 1.0]` 的实数集合,并且数据类型被设定为了 `np.float32`: ```python import numpy as np import gym class ActionSpace: @staticmethod def from_type(action_type: int): space_type = ActionSpaceType(action_type) if space_type == ActionSpaceType.Continuous: return gym.spaces.Box( low=np.array([0.0, 0.0, -1.0]), high=np.array([1.0, 1.0, 1.0]), dtype=np.float32, ) ``` 此段代码展示了如何通过传递最低限度(`low`)数组以及最高限度(`high`)数组来初始化一个新的Box实例,从而构建出一个具有特定界限的多维连续数值区间作为环境可能采取的一系列合法行为的选择集的一部分。 另外值得注意的是,每个环境都应当具备属性 `action_space` 和 `observation_space` ,这两个属性应该是继承自 `Space` 类的对象实例;Gymnasium库支持大多数用户可能会需要用到的不同种类的空间实现方式[^2]。 #### 创建并测试 Box 动作空间的一个简单例子 下面是一个简单的Python脚本片段用于展示怎样创建和验证一个基本的 `Box` 空间成员资格的方法: ```python def check_box_space(): box_space = gym.spaces.Box(low=-1.0, high=1.0, shape=(2,), dtype=np.float32) sample_action = box_space.sample() # 获取随机样本 is_valid = box_space.contains(sample_action) # 检查合法性 print(f"Sampled action {sample_action} within bounds? {'Yes' if is_valid else 'No'}") check_box_space() ``` 上述函数首先建立了一个二维的 `-1.0` 到 `1.0` 范围内的浮点型 `Box` 空间,接着从中抽取了一组随机样本来检验它确实位于所规定的范围内。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值