基于深度强化学习的多码头集卡路径优化

莫聽穿林打叶聲

已于 2025-05-25 20:10:49 修改

阅读量888

点赞数 26

分类专栏： # 多码头间集卡路径优化文章标签：强化学习多码头集卡路径优化 Q学习 DQN

于 2024-12-03 16:51:56 首次发布

本文链接：https://blog.youkuaiyun.com/qq_43276566/article/details/143165159

版权

ADI T N, ISKANDAR Y A, BAE H. Interterminal Truck Routing Optimization Using Deep Reinforcement Learning[J]. Sensors, 2020, 20(20): 5794.
ADI T N, BAE H, ISKANDAR Y A. Interterminal Truck Routing Optimization Using Cooperative Multiagent Deep Reinforcement Learning[J]. Processes, 2021, 9(10): 1728.

Problem Description

问题定义：

实验设置：

不包括外集卡： 提出的ITTRP版本不考虑外部集卡。
实验范围： 釜山新港（Busan New Port，BNP），拥有五个集装箱码头（PNIT、PNC、HJNC、HPNT、BNCT），决策期：24小时，即1440分钟

符号定义：

目标函数：

最小化成本： 使用集卡的成本 $\displaystyle \min \left( \sum_{t\in T} x_t cs_t + \sum_{t\in T} tm_t hr_t + \sum_{o \in O} y_o pn_o\right)$
成本组成部分：
- 集卡使用成本： $\displaystyle \sum_{t \in T} x_t cs_t$
- 集卡工作时间成本： $\displaystyle \sum_{t \in T} tm_t hr_t$
- 订单延迟罚款： $\displaystyle \sum_{o \in O} y_o pn_o$