29、加权空间网络权衡分析与多智能体强化学习可解释策略探索

open4

于 2025-07-20 13:52:37 发布

阅读量4

点赞数

CC 4.0 BY-SA版权

分类专栏：仿生优化方法及其应用：BIOMA 2022会议精华文章标签：加权空间网络多智能体强化学习可解释策略

本文链接：https://blog.youkuaiyun.com/open4/article/details/149508512

仿生优化方法及其应用：BIOMA 2022会议精华专栏收录该内容

30 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

加权空间网络权衡分析与多智能体强化学习可解释策略探索

在现代社会，新铺设的网络需要考虑建筑物、地形和土地价格等因素，这导致了实施成本的空间差异。同时，多智能体强化学习在取得显著进展的同时，也面临着策略难以解释的问题。本文将分别介绍加权空间网络构建方法以及多智能体强化学习可解释策略的相关研究。

加权空间网络构建

算法介绍

算法 1 是加权空间上的 WTSN 算法，其输入包括加权空间、需求顶点集、行走阻力的下降速度、增加速度、初始行走阻力、收敛行走阻力以及智能体的小迂回偏好程度，输出为网络。以下是该算法的详细步骤：

Input:
加权空间 
, 
需求顶点集 
, 
行走阻力下降速度 
, 
行走阻力增加速度 
, 
初始行走阻力 
, 
收敛行走阻力 
, 
智能体小迂回偏好程度 

Output: 网络 

1. 在  上生成 rDn
2. 
3. 
4. 对于 
,
, 和 
5. 
6. 当  或  未连接  时
7.  
8.  ，从  中随机选择两个需求顶点（ ）
9.  由对数正态分布生成的随机数
10.  在 rDn 上  和  之间由  加权的最短路径
11. 对于 
12.  获取 
13.  更新 
14.  将  更新为 
15. 
16. 
17. 如果 
18.  
19. 否则
20.  
21. 
22. 返回