29、加权空间网络权衡分析与多智能体强化学习可解释策略探索

加权空间网络权衡分析与多智能体强化学习可解释策略探索

在现代社会,新铺设的网络需要考虑建筑物、地形和土地价格等因素,这导致了实施成本的空间差异。同时,多智能体强化学习在取得显著进展的同时,也面临着策略难以解释的问题。本文将分别介绍加权空间网络构建方法以及多智能体强化学习可解释策略的相关研究。

加权空间网络构建
算法介绍

算法 1 是加权空间上的 WTSN 算法,其输入包括加权空间、需求顶点集、行走阻力的下降速度、增加速度、初始行走阻力、收敛行走阻力以及智能体的小迂回偏好程度,输出为网络。以下是该算法的详细步骤:

Input:
加权空间 
, 
需求顶点集 
, 
行走阻力下降速度 
, 
行走阻力增加速度 
, 
初始行走阻力 
, 
收敛行走阻力 
, 
智能体小迂回偏好程度 

Output: 网络 

1. 在  上生成 rDn
2. 
3. 
4. 对于 
,
, 和 
5. 
6. 当  或  未连接  时
7.  
8.  ,从  中随机选择两个需求顶点( )
9.  由对数正态分布生成的随机数
10.  在 rDn 上  和  之间由  加权的最短路径
11. 对于 
12.  获取 
13.  更新 
14.  将  更新为 
15. 
16. 
17. 如果 
18.  
19. 否则
20.  
21. 
22. 返回 
实验空间设置

为了分析加权空间对帕累托前沿的影响,准备了几个模拟真实空间的实验空间,具体如下:
- 案例 1 - 1 和 1 - 2 :具有凸

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值