GYM 100488 B.Impossible to Guess(构造)

本文介绍了一种通过多次查询升序排列子序列来复原原始排列的方法。利用[n/2]次查询,每次查询获得子序列升序排列,通过比较不同查询结果间的差异,逐步确定原始排列中的每个元素。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Description
一个1~n的排列p[1],p[2],…,p[n],每次询问区间[l,r]会告诉将p[l],…,p[r]升序排列后输出,至多[n/2]次询问复原p序列
Input
一个整数n表示序列长度(1<=n<=100)
Output
输出Q l r表示询问[l,r],之后会告诉升序排列后的p[l],…,p[r],当确定p序列后,输出A,之后输出这n个数
Sample Input
3
3
1 3
Sample Output
Q 1 1
Q 1 2
A 3 1 2
Solution
[n/2]次查询[i,i+(n-1)/2](1<=i<=(n+1)/2],每次查询用一个set存起来,那么相邻两个set的差就可以确定两个数字,那么我们就确定了1,2,…,(n-1)/2,(n+1)/2+1,…,(n-1)/2+(n-1)/2+1,当n为奇数时只有(n+1)/2未被确定,而第一次查询已经知道了前(n+1)/2个数字,现在前(n-1)/2个数字已经确定,故从set中删去这些数后剩余的就是(n+1)/2位置的数,当n为偶数时,第n个位置的数也确定不了,但是由于这是一个1~n的排列,而且前n-1个数已经确定,故剩余的数字就是第n个位置的数

以1 2 3 4 5和1 2 3 4 5 6为例:

1 2 3 4 5:查询(1,3),(2,4),(3,5)
(1,3)和(2,4)比较就得到了1位置和4位置的答案
(2,4)和(3,5)比较就得到了2位置和5位置的答案
从(1,3)的查询中删去1,2位置的数字就是3位置的答案

1 2 3 4 5 6:查询(1,3),(2,4),(3,5)
(1,3)和(2,4)比较就得到了1位置和4位置的答案
(2,4)和(3,5)比较就得到了2位置和5位置的答案
从(1,3)的查询中删去1,2位置的数字就是3位置的答案
从1~n中删去1,2,3,4,5位置的数字就是6位置的答案
Code

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<vector>
#include<queue>
#include<map>
#include<set>
#include<ctime>
using namespace std;
typedef long long ll;
#define INF 0x3f3f3f3f
#define maxn 111
set<int>s[maxn];
set<int>::iterator it;
int n,a[maxn];
int main()
{
    while(~scanf("%d",&n))
    {
        s[0].clear();
        for(int i=1;i<=(n+1)/2;i++)
        {
            s[i].clear();
            printf("Q %d %d\n",i,(n-1)/2+i);cout.flush();
            for(int j=0;j<(n+1)/2;j++)
            {
                int temp;
                scanf("%d",&temp);
                s[i].insert(temp);
                s[0].insert(temp);
            }
        }
        for(int i=1;i<=(n-1)/2;i++)
        {
            for(it=s[i].begin();it!=s[i].end();it++)
                if(s[i+1].find(*it)==s[i+1].end())
                {
                    a[i]=*it;
                    break;
                }
            for(it=s[i+1].begin();it!=s[i+1].end();it++)
                if(s[i].find(*it)==s[i].end())
                {
                    a[(n-1)/2+i+1]=*it;
                    break;
                }
        }
        for(int i=1;i<=(n-1)/2;i++)s[1].erase(a[i]);
        a[(n+1)/2]=*s[1].begin();
        if(n%2==0)
        {
            for(int i=1;i<=n;i++)
                if(s[0].find(i)==s[0].end())
                {
                    a[n]=i;
                    break;
                }
        }
        printf("A ");
        for(int i=1;i<=n;i++)
            printf("%d%c",a[i],i==n?'\n':' '),cout.flush();
    }
    return 0;
}
### 使用 `gym.spaces.Box` 定义动作空间 在OpenAI Gym环境中定义连续的动作空间通常会使用到 `gym.spaces.Box` 类。此类允许创建一个多维的盒子形状的空间,其边界由低限(low)和高限(high)参数指定[^1]。 对于给定的例子,在类 `ActionSpace` 中静态方法 `from_type` 返回了一个基于输入类型的行动空间实例: 当 `space_type` 是 `Continuous` 时,返回的是一个三维向量形式的动作空间对象,该对象表示三个维度上的取值范围分别为 `[0.0, 1.0]`, `[0.0, 1.0]`, 和 `[-1.0, 1.0]` 的实数集合,并且数据类型被设定为了 `np.float32`: ```python import numpy as np import gym class ActionSpace: @staticmethod def from_type(action_type: int): space_type = ActionSpaceType(action_type) if space_type == ActionSpaceType.Continuous: return gym.spaces.Box( low=np.array([0.0, 0.0, -1.0]), high=np.array([1.0, 1.0, 1.0]), dtype=np.float32, ) ``` 此段代码展示了如何通过传递最低限度(`low`)数组以及最高限度(`high`)数组来初始化一个新的Box实例,从而构建出一个具有特定界限的多维连续数值区间作为环境可能采取的一系列合法行为的选择集的一部分。 另外值得注意的是,每个环境都应当具备属性 `action_space` 和 `observation_space` ,这两个属性应该是继承自 `Space` 类的对象实例;Gymnasium库支持大多数用户可能会需要用到的不同种类的空间实现方式[^2]。 #### 创建并测试 Box 动作空间的一个简单例子 下面是一个简单的Python脚本片段用于展示怎样创建和验证一个基本的 `Box` 空间成员资格的方法: ```python def check_box_space(): box_space = gym.spaces.Box(low=-1.0, high=1.0, shape=(2,), dtype=np.float32) sample_action = box_space.sample() # 获取随机样本 is_valid = box_space.contains(sample_action) # 检查合法性 print(f"Sampled action {sample_action} within bounds? {'Yes' if is_valid else 'No'}") check_box_space() ``` 上述函数首先建立了一个二维的 `-1.0` 到 `1.0` 范围内的浮点型 `Box` 空间,接着从中抽取了一组随机样本来检验它确实位于所规定的范围内。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值