基于深度强化学习的多码头集卡路径优化

  • ADI T N, ISKANDAR Y A, BAE H. Interterminal Truck Routing Optimization Using Deep Reinforcement Learning[J]. Sensors, 2020, 20(20): 5794.
  • ADI T N, BAE H, ISKANDAR Y A. Interterminal Truck Routing Optimization Using Cooperative Multiagent Deep Reinforcement Learning[J]. Processes, 2021, 9(10): 1728.

Problem Description

问题定义:

  • 问题类型: 同车型车辆取送货问题(Homogeneous Vehicle Pickup and Delivery Problem, ITTRP)
  • 考虑因素:
    • 集卡工作时间的最大可用性
    • 延迟订单的罚款
    • 节点的时间窗
    • 运输订单的截止时间

实验设置:

  • 不包括外集卡: 提出的ITTRP版本不考虑外部集卡。
  • 实验范围: 釜山新港(Busan New Port,BNP),拥有五个集装箱码头(PNIT、PNC、HJNC、HPNT、BNCT),决策期:24小时,即1440分钟

符号定义:

  • 节点集合: L L L
  • 集卡集合: T T T
  • 客户集合: C C C
  • 客户k的订单集合: R k R^k Rk,其中 k k k 是客户的索引。
  • 所有订单集合: O = ∪ k ∈ C R k \displaystyle O = \cup_{k \in C} R^k O=kCRk
  • 订单的起始码头: o ( j i k ) ∈ L o(j_i^k) \in L o(jik)L
  • 订单的目标码头: d ( j i k ) ∈ L d(j_i^k) \in L d(jik)L
  • 起始码头集合: L s L^s Ls
  • 目标码头集合: L d L^d Ld
  • 服务时间: 取货点 S j i k , o ( j i k ) S_{j_i^k,o(j_i^k)} Sjik,o(jik) 和送货点 S j i k , d ( j i k ) S_{j_i^k, d(j_i^k)} Sjik,d(jik)的服务时间。
  • 订单罚款: p n j i k \displaystyle pn_{j^k_i} pnjik
  • 截止日期: d d j i k dd_{j^k_i} ddjik
  • 集卡初始位置: i p t ip_t ipt
  • 集卡最大工作时间: m x t mx_t mxt
  • 集卡使用成本: c s t cs_t cst
  • 集卡小时成本: h r t hr_t hrt

目标函数:

  • 最小化成本: 使用集卡的成本 min ⁡ ( ∑ t ∈ T x t c s t + ∑ t ∈ T t m t h r t + ∑ o ∈ O y o p n o ) \displaystyle \min \left( \sum_{t\in T} x_t cs_t + \sum_{t\in T} tm_t hr_t + \sum_{o \in O} y_o pn_o\right) min(tTxtcst+tTtmthrt+oOyopno)
  • 成本组成部分:
    • 集卡使用成本: ∑ t ∈ T x t c s t \displaystyle \sum_{t \in T} x_t cs_t tTxtcst
    • 集卡工作时间成本: ∑ t ∈ T t m t h r t \displaystyle \sum_{t \in T} tm_t hr_t tTtmthrt
    • 订单延迟罚款: ∑ o ∈ O y o p n o \displaystyle \sum_{o \in O} y_o pn_o oOyopno

变量定义:

  • 集卡是否被雇佣: x t = 1 x_t = 1 xt=1 如果集卡 t t t 被雇佣,否则为 0 0 0
  • 订单是否延迟: y o = 1 y_o = 1 yo=1 如果订单 o o o 在截止日期后执行,否则为 0 0 0
  • 集卡服务时间: t m t tm_t tmt

限制条件:

  1. Each transport order must be performed.
  2. Each transport order must be performed by a single truck.
  3. Each transport order j i k j^k_i ji
资源下载链接为: https://pan.quark.cn/s/ab08c24cda4d 本项目基于 PyTorch 实现了 CSRNet(卷积稀疏表示网络)人群计数模型。CSRNet 是一种高效且精准的人群密度估计方法,尤其适合高密度场景下的人群计数。该模型借助卷积神经网络(CNN)的特性,利用稀疏表示来应对复杂背景和密人群的挑战。以下将详细介绍 CSRNet 的核心概念、结构及实现过程,并阐述人群计数的重要性。 人群计数在公共场所安全监控、交通管理和大型活动组织等领域极为关键。准确估计人群数量有助于保障安全和优化管理。传统计数方法如人工计数或基于规则的方法效率低且易出错而,深度学习技术的引入,尤其是 CSRNet 这类模型,显著提高了计数的准确性和效率。 CSRNet 的核心在于其深度卷积网络结构和稀疏表示能力。该模型通过尺度特征提取,适应不同大小的人头。其架构包含个卷积层,每层后接 Leaky ReLU 激活函数,增强非线性表达能力。此外,CSRNet 引入了空洞卷积(也称 atrous convolution),可在不增加参数数量的情况下扩大感受野,更高效地捕捉大范围信息。具体架构包括:输入层接收预处理后的图像;基础网络通常使用预训练的 VGG16 提取层次特征;尺度特征融合通过不同扩张率的空洞卷积获得不同分辨率的特征图;解码器利用反卷积操作将低分辨率特征图恢复至原始尺寸,结合尺度信息重建上下文;稀疏表示层是 CSRNet 的独特之处,通过稀疏编码和解码,将高维特征转换为低维稀疏表示,降低背景噪声影响,提升人头检测精度;输出层通过 1×1 卷积将特征图转化为人群密度图,再经全局平均池化和全连接层得到最终计数结果。 在实现过程中,需注意以下几点:数据预处理,如缩放、归一化、增强等,以提升模型泛化能力;训练策略,包括数据划分、学习率调度、损失函数选择(如
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值