把“线网-车站-列车”三级实体抽象为三级多智能体深度强化学习博弈(Hierarchical-MADRL-Games,HMADG),并嵌入我们之前定义的“反馈-演化”动力学,实现业务 KPI 双向放大。
一、三级博弈抽象与角色定义
表格
复制
| 层级 | 智能体角色 | 主要决策变量 | 观测空间 | 关键业务 KPI |
|---|---|---|---|---|
| L1 线网层 | Network-Agent (NA) | 全线列车运行图、越站/加开、末班车衔接 | 全线 OD、大客流预警、故障事件 | 网络总延误 ∑D、换乘失败率 P_transfer |
| L2 车站层 | Station-Agent (SA) | 限流速率、闸机常开/常关、广播等级 | 站台密度、闸机队列、SA-NA 运行图 | 站台滞留人数 Q_strand、清客时间 T_clear |
| L3 列车层 | Train-Agent (TA) | 牵引/制动曲线、停站时间、跳停决策 | 车载客流、信号机状态、TA-SA 上下客 | 列车晚点 d_train、能耗 E_train |
-
博弈顺序:NA 先发布“运行图指令”→SA 根据客流决定限流→TA 在约束下调节停站/速度;每 30 s 滚动一次

最低0.47元/天 解锁文章
1142

被折叠的 条评论
为什么被折叠?



