加权空间网络权衡分析与多智能体强化学习可解释策略探索
在现代社会,新铺设的网络需要考虑建筑物、地形和土地价格等因素,这导致了实施成本的空间差异。同时,多智能体强化学习在取得显著进展的同时,也面临着策略难以解释的问题。本文将分别介绍加权空间网络构建方法以及多智能体强化学习可解释策略的相关研究。
加权空间网络构建
算法介绍
算法 1 是加权空间上的 WTSN 算法,其输入包括加权空间、需求顶点集、行走阻力的下降速度、增加速度、初始行走阻力、收敛行走阻力以及智能体的小迂回偏好程度,输出为网络。以下是该算法的详细步骤:
Input:
加权空间
,
需求顶点集
,
行走阻力下降速度
,
行走阻力增加速度
,
初始行走阻力
,
收敛行走阻力
,
智能体小迂回偏好程度
Output: 网络
1. 在 上生成 rDn
2.
3.
4. 对于
,
, 和
5.
6. 当 或 未连接 时
7.
8. ,从 中随机选择两个需求顶点( )
9. 由对数正态分布生成的随机数
10. 在 rDn 上 和 之间由 加权的最短路径
11. 对于
12. 获取
13. 更新
14. 将 更新为
15.
16.
17. 如果
18.
19. 否则
20.
21.
22. 返回
实验空间设置
为了分析加权空间对帕累托前沿的影响,准备了几个模拟真实空间的实验空间,具体如下:
- 案例 1 - 1 和 1 - 2 :具有凸