CF Gym 102114B. Beautiful Now解题报告(搜索+贪心)

本文详细解析了CodeForces竞赛中一道关于通过交换数字达到最值的问题,介绍了如何在有限的交换次数内获得最大和最小数值的策略,特别关注了数字长度与交换次数的关系。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目链接:http://codeforces.com/gym/102114/problem/B
题目描述:

给定一个整数(这个数的位数较小), 你可以将任意两个位置的数进行交换, 可以进行最多 k k k k k k可能很大)次, 问你能够达到的最小和最大的数是多少。

题解:

首先发现这个数字只有9位数, 而交换次数可能很多, 如果要求最小的数字,那么每次交换把最小的放前面, 求最大的数字只需要反过来操作即可(将最大的放在前面,最小的数字放在后面), 但是这样在次数够的时候能够保证正确性, 如果次数不够不一定能最优。考虑什么情况次数不够, 可以发现只有当次数小于给定数字的长度时候才有可能不能使得各个位置的数字递增或者递减。这是因为每次选择最大(或者最小的数字)放在首位,最多只需要选择 l e n − 1 len-1 len1次就能保证各个位置的数字递增或者递减, 但是要注意前导 0 0 0的处理, 题目要求结果不能有前导 0 0 0。而如果可以交换的次数小于 l e n − 1 len-1 len1此时 k k k也就变得非常小了,此时进行暴力即可,以求最小值的暴力搜索为例,每次记录当前位置到结尾的最小值及其出现的各个位置,如果还能进行交换,则依次选择后续的某一个数字和当前位置进行交换即可。

代码:

#include <bits/stdc++.h>

typedef long long ll;

const int maxn = 1e3 + 10;

using namespace std;

int t, k, len; 
string s1, s, s2;

void dfs(int dep, int num){
	s2 = min(s2, s);
	if (num == k) return ;
	if (dep == len - 1) return ;
	int minnum = 11, pos = -1;
	for (int i = dep;i < len;i ++){
		if (dep == 0){
			if (s[i] - '0' < minnum && s[i] - '0' != 0){
				minnum = s[i] - '0';
				pos = i;
			}
		}
		else{
			if (s[i] - '0' < minnum){
				minnum = s[i] - '0';
				pos = i;
			}
		}
	}
	int p[12], cnt = 0;
	for (int i = dep+1;i < len;i ++)
		if (s[i] - '0' == minnum) p[++cnt] = i;
	if (minnum == s[dep] - '0'){
		dfs(dep + 1, num);
		return ;
	}
	for (int i = 1;i <= cnt;i ++){
		swap(s[p[i]], s[dep]);
		dfs(dep+1, num+1);
		swap(s[p[i]], s[dep]);
	}
}
void dfs2(int dep, int num){
	s2 = max(s2, s);
	if (num == k) return ;
	if (dep == len - 1) return ;
	int maxnum = -1, pos = -1;
	for (int i = dep;i < len;i ++){
		if (s[i] - '0' > maxnum){
			maxnum = s[i] - '0';
			pos = i;
		}
	}
	int p[12], cnt = 0;
	for (int i = dep+1;i < len;i ++)
		if (s[i] - '0' == maxnum) p[++cnt] = i;
	if (maxnum == s[dep] - '0'){
		dfs2(dep + 1, num);
		return ;
	}
	for (int i = 1;i <= cnt;i ++){
		swap(s[p[i]], s[dep]);
		dfs2(dep+1, num+1);
		swap(s[p[i]], s[dep]);
	}
}
int main(){
	cin >> t;
	while(t --){
		s1.clear();
		cin >> s1 >> k;
		s.clear();
		s2.clear();
		s = s1;
		len = s1.length();
		if (k >= len-1){
			sort(s1.begin(), s1.end());
			if (s1[0] == '0'){
				int pp = -1;
				for (int i = 0;i < len;i ++){
					if (s1[i] != '0'){
						pp = i;
						break;
					}
				}
				if (pp == -1) printf("0");
				else{
					printf("%c", s1[pp]);
					for (int i = 0;i < len;i ++){
						if (i == pp) continue;
						printf("%c", s1[i]);
					}
				}
			}
			else for (int i = 0;i < len;i ++) printf("%c", s1[i]);
			printf(" ");
			for (int i = len-1;i >= 0;i --) printf("%c", s1[i]);
			cout << endl;
			continue;
		}
		s2 = "9999999999";
		dfs(0, 0);
		cout << s2 << " ";
		s2.clear();
		s2 = "0000000000";
		s = s1;
		dfs2(0, 0);
		cout << s2 << endl;
	}
}
### 使用 `gym.spaces.Box` 定义动作空间 在OpenAI Gym环境中定义连续的动作空间通常会使用到 `gym.spaces.Box` 类。此类允许创建一个多维的盒子形状的空间,其边界由低限(low)和高限(high)参数指定[^1]。 对于给定的例子,在类 `ActionSpace` 中静态方法 `from_type` 返回了一个基于输入类型的行动空间实例: 当 `space_type` 是 `Continuous` 时,返回的是一个三维向量形式的动作空间对象,该对象表示三个维度上的取值范围分别为 `[0.0, 1.0]`, `[0.0, 1.0]`, 和 `[-1.0, 1.0]` 的实数集合,并且数据类型被设定为了 `np.float32`: ```python import numpy as np import gym class ActionSpace: @staticmethod def from_type(action_type: int): space_type = ActionSpaceType(action_type) if space_type == ActionSpaceType.Continuous: return gym.spaces.Box( low=np.array([0.0, 0.0, -1.0]), high=np.array([1.0, 1.0, 1.0]), dtype=np.float32, ) ``` 此段代码展示了如何通过传递最低限度(`low`)数组以及最高限度(`high`)数组来初始化一个新的Box实例,从而构建出一个具有特定界限的多维连续数值区间作为环境可能采取的一系列合法行为的择集的一部分。 另外值得注意的是,每个环境都应当具备属性 `action_space` 和 `observation_space` ,这两个属性应该是继承自 `Space` 类的对象实例;Gymnasium库支持大多数用户可能会需要用到的不同种类的空间实现方式[^2]。 #### 创建并测试 Box 动作空间的一个简单例子 下面是一个简单的Python脚本片段用于展示怎样创建和验证一个基本的 `Box` 空间成员资格的方法: ```python def check_box_space(): box_space = gym.spaces.Box(low=-1.0, high=1.0, shape=(2,), dtype=np.float32) sample_action = box_space.sample() # 获取随机样本 is_valid = box_space.contains(sample_action) # 检查合法性 print(f"Sampled action {sample_action} within bounds? {'Yes' if is_valid else 'No'}") check_box_space() ``` 上述函数首先建立了一个二维的 `-1.0` 到 `1.0` 范围内的浮点型 `Box` 空间,接着从中抽取了一组随机样本来检验它确实位于所规定的范围内。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值