GYM 100801 G.Graph(贪心+拓扑排序+优先队列)

本文介绍了一种算法,用于在一个有向无环图中通过增加一定数量的边来最大化其字典序最小的拓扑排序。文章详细解释了解决方案,并提供了一个具体的示例和源代码实现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Description

给出一张nnn个点mmm条边的有向无环图,最多加kkk条边使得该图仍无环且使得字典序最小的拓扑序字典序尽可能大

Input

第一行三个整数n,m,kn,m,kn,m,k,之后mmm行每行输入两个整数u,vu,vu,v表示一条有向边(1≤n≤105,0≤m,k≤105)(1\le n\le 10^5,0\le m,k\le 10^5)(1n105,0m,k105)

Output

输出最大化字典序后的字典序最小的拓扑序列,和要加边的数量及这些边

Sample Input

5 3 2
1 4
4 2
1 3

Sample Output

5 1 4 2 3
2
4 3
5 1

Solution

对于当前入度为000的点,为使字典序最小的拓扑序字典序最大(避免冗余下面所称字典序均为已经最大化后的最小字典序),如果可以当然让这些点中编号最大的点作为当前字典序最高的点(即还可以加的边数可以让该点与其他入度为000的点都连边使得该点拓扑序最高),如果还可以加的边数不够,那么只能尽可能处理其中编号较小的点,即向这些编号较小的点连边使得这些点不可能出现在拓扑序的这一位,但是注意到,我们只能确定向哪些点连边,但是这些边的起点还不确定,所以首先拿一个小根堆ppp维护入度为000的点,拿一个大根堆qqq维护要被加边的点(即那些确定是某些有向边终点的边),用aaa存字典序上一位,用bbb存字典序当前位,那么要解决的问题就是求bbb

如果ppp非空且k>0k>0k>0说明当然还可以通过加边处理ppp里编号较小的点,把这些点一个个从ppp中拿出来,假设当前拿出来的点是xxx,如果xxx大于qqq的堆顶yyyxxxppp里最后一个元素,那么说明当前步是可以做到让b=xb=xb=x,这已经是最好的结果了,就不浪费一次加边的机会,否则k−−k--k,把xxxppp中拿出来放到qqq里表示xxx将作为某条加边的终点被处理掉

在经过上面的处理后,当前步可以处理掉的入度为000的点已经被全部处理掉了,此时若ppp空,说明所有入度为000的点全被处理掉放在qqq里了,既然qqq里的点都已经作为某条加边的终点了,当然是可以取到qqq中编号最大的元素作为字典序当前位的,取出qqq的堆顶即为bbb(从aaabbb连边,这样bbb就是当前唯一入度为000的点),如果ppp非空,说明入度为000的点没有被完全处理完,那么只能选取其中编号最小的点作为字典序当前位,取出ppp的堆顶即为bbb,确定bbb后把bbb放入字典序当前位,然后把bbb的邻接点入度减一,如果出现新的入度为000的点接着加入ppp中重复上述过程即可

Code

#include<cstdio>
#include<iostream>
#include<cstring>
#include<algorithm>
#include<cmath>
#include<vector>
#include<queue>
#include<map>
#include<set>
#include<ctime>
using namespace std;
typedef long long ll;
typedef pair<int,int>P;
const int INF=0x3f3f3f3f,maxn=100005;
int n,m,k,deg[maxn],ans[maxn];
vector<int>g[maxn];
vector<P>add;
priority_queue< int,vector<int>,greater<int> >p;
priority_queue<int>q;
int main()
{
	freopen("graph.in","r",stdin);
	freopen("graph.out","w",stdout);
	while(~scanf("%d%d%d",&n,&m,&k))
	{
		for(int i=1;i<=n;i++)g[i].clear(),deg[i]=0;
		while(m--)
		{
			int u,v;
			scanf("%d%d",&u,&v);
			g[u].push_back(v);
			deg[v]++;
		}
		while(!p.empty())p.pop();
		while(!q.empty())q.pop();
		add.clear();
		for(int i=1;i<=n;i++)
			if(!deg[i])p.push(i);
		int a,b;
		for(int i=0;i<n;i++)
		{
			while(p.size()&&k)
			{
				int x=p.top(),y=-1;
				if(q.size())y=q.top();
				if(x>y&&p.size()==1)break;
				p.pop(),q.push(x),k--;
			}
			//printf("%d\n",p.top());
			if(p.size())
			{
				b=p.top();p.pop();
			}
			else
			{
				b=q.top();q.pop();
				add.push_back(P(a,b));
			}
			ans[i]=b;
			for(int i=0;i<g[b].size();i++)
			{
				int c=g[b][i];
				deg[c]--;
				if(!deg[c])p.push(c);
			}
			a=b;
		}
		for(int i=0;i<n;i++)printf("%d%c",ans[i],i==n-1?'\n':' ');
		printf("%d\n",add.size());
		for(int i=0;i<add.size();i++)printf("%d %d\n",add[i].first,add[i].second); 
	}
	return 0;
}
### 使用 `gym.spaces.Box` 定义动作空间 在OpenAI Gym环境中定义连续的动作空间通常会使用到 `gym.spaces.Box` 类。此类允许创建一个多维的盒子形状的空间,其边界由低限(low)和高限(high)参数指定[^1]。 对于给定的例子,在类 `ActionSpace` 中静态方法 `from_type` 返回了一个基于输入类型的行动空间实例: 当 `space_type` 是 `Continuous` 时,返回的是一个三维向量形式的动作空间对象,该对象表示三个维度上的取值范围分别为 `[0.0, 1.0]`, `[0.0, 1.0]`, 和 `[-1.0, 1.0]` 的实数集合,并且数据类型被设定为了 `np.float32`: ```python import numpy as np import gym class ActionSpace: @staticmethod def from_type(action_type: int): space_type = ActionSpaceType(action_type) if space_type == ActionSpaceType.Continuous: return gym.spaces.Box( low=np.array([0.0, 0.0, -1.0]), high=np.array([1.0, 1.0, 1.0]), dtype=np.float32, ) ``` 此段代码展示了如何通过传递最低限度(`low`)数组以及最高限度(`high`)数组来初始化一个新的Box实例,从而构建出一个具有特定界限的多维连续数值区间作为环境可能采取的一系列合法行为的选择集的一部分。 另外值得注意的是,每个环境都应当具备属性 `action_space` 和 `observation_space` ,这两个属性应该是继承自 `Space` 类的对象实例;Gymnasium库支持大多数用户可能会需要用到的不同种类的空间实现方式[^2]。 #### 创建并测试 Box 动作空间的一个简单例子 下面是一个简单的Python脚本片段用于展示怎样创建和验证一个基本的 `Box` 空间成员资格的方法: ```python def check_box_space(): box_space = gym.spaces.Box(low=-1.0, high=1.0, shape=(2,), dtype=np.float32) sample_action = box_space.sample() # 获取随机样本 is_valid = box_space.contains(sample_action) # 检查合法性 print(f"Sampled action {sample_action} within bounds? {'Yes' if is_valid else 'No'}") check_box_space() ``` 上述函数首先建立了一个二维的 `-1.0` 到 `1.0` 范围内的浮点型 `Box` 空间,接着从中抽取了一组随机样本来检验它确实位于所规定的范围内。
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值