✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。
🍎 往期回顾关注个人主页:Matlab科研工作室
🍊个人信条:格物致知,完整Matlab代码及仿真咨询内容私信。
🔥 内容介绍
随着共享经济的蓬勃发展,自行车租赁作为城市交通系统的重要组成部分,其便捷性和环保性受到广泛认可。然而,自行车租赁数量的波动性对运营管理带来了挑战。精准预测自行车租赁数量,对于优化车辆调度、提升用户体验以及提高运营效率具有重要意义。本文提出了一种基于时间卷积网络(TCN)和双向门控循环单元(BiGRU)的混合模型(TCN-BiGRU)用于自行车租赁数量预测。该模型旨在有效捕捉时间序列数据中的局部特征和长期依赖关系。TCN层负责提取时间序列的局部上下文信息和多尺度特征,而BiGRU层则能够捕捉序列数据的双向依赖关系。通过在公开数据集上进行实验,并与单一模型(如TCN、GRU、LSTM)以及其他混合模型进行对比分析,结果表明TCN-BiGRU模型在预测精度和稳定性方面均表现出优越性。这为自行车租赁平台的智能运营和决策提供了有力的技术支持。
关键词: 自行车租赁;数量预测;时间卷积网络(TCN);双向门控循环单元(BiGRU);深度学习
1. 引言
近年来,全球城市化进程加速,交通拥堵和环境污染问题日益突出。作为一种绿色、健康的出行方式,自行车租赁系统在缓解城市交通压力、减少碳排放方面发挥着重要作用。共享单车的普及,使得自行车租赁服务深入人心,成为许多城市居民日常通勤和休闲出行的重要选择。然而,自行车租赁数量受多种复杂因素影响,如天气条件、节假日、特殊事件、时间周期性(小时、日、周)以及用户行为模式等,呈现出显著的非线性和波动性。这种复杂性使得准确预测自行车租赁需求成为一个具有挑战性的任务。
当前,自行车租赁平台的运营管理面临诸多挑战。例如,在高峰时段,某些区域的自行车可能供不应求,导致用户无法及时租到车辆;而在低谷时段,大量自行车闲置,造成资源浪费。为了有效解决这些问题,实现资源的合理配置和最大化利用,亟需开发出高效、准确的自行车租赁数量预测模型。精准的预测结果可以指导运营方提前进行车辆调度,将车辆从需求较低的区域调配到需求较高的区域,从而提高车辆周转率,减少空车率,提升用户满意度,降低运营成本。
传统的预测方法,如时间序列模型(ARIMA、指数平滑等)和机器学习模型(支持向量机、随机森林等),在处理复杂的非线性时间序列数据时往往存在局限性,难以充分捕捉多变因素之间的复杂关联。随着深度学习技术的快速发展,其在处理大规模、高维度数据以及捕捉复杂模式方面的强大能力,为时间序列预测带来了新的机遇。循环神经网络(RNN)及其变种,如长短期记忆网络(LSTM)和门控循环单元(GRU),因其擅长处理序列数据而被广泛应用于时间序列预测任务。然而,标准的RNNs在处理长序列时可能面临梯度消失或梯度爆炸问题,且难以同时捕捉局部特征和长期依赖。近年来,时间卷积网络(TCN)因其并行计算能力和在时间序列数据上表现出的优异性能而受到关注。TCN通过膨胀卷积和残差连接,能够有效扩大感受野,捕捉长距离依赖,同时保持局部特征的提取能力。
本文旨在结合TCN和BiGRU的优势,提出一种新型的混合深度学习模型——TCN-BiGRU,用于自行车租赁数量的精准预测。该模型将TCN的局部特征提取能力与BiGRU的双向长期依赖捕捉能力相结合,以期在复杂多变的自行车租赁数量时间序列数据上取得更优的预测性能。
2. 相关工作
自行车租赁数量预测是一个活跃的研究领域,已经涌现出多种预测方法。这些方法大致可以分为传统统计方法、传统机器学习方法和深度学习方法。
2.1 传统统计方法
传统统计方法主要基于时间序列分析。例如,自回归积分滑动平均模型(ARIMA)是时间序列预测中最常用的统计模型之一,它通过对数据进行差分、自回归和移动平均操作来捕捉时间序列的线性关系。季节性ARIMA(SARIMA)模型进一步扩展了ARIMA,以处理具有季节性周期的数据。此外,指数平滑(Exponential Smoothing)方法通过对历史数据加权平均来预测未来值,常见的有简单指数平滑、霍尔特(Holt)指数平滑和霍尔特-温特斯(Holt-Winters)指数平滑等。尽管这些方法在某些线性或具有明显周期性的时间序列预测中表现良好,但它们通常难以有效捕捉自行车租赁数据中复杂的非线性关系和多重影响因素。
2.2 传统机器学习方法
传统机器学习方法通过构建映射函数来捕捉输入特征与预测目标之间的关系。常用的方法包括:
- 支持向量回归(SVR):
SVR是支持向量机在回归问题上的应用,通过寻找一个最优超平面来拟合数据,具有较好的泛化能力。
- 随机森林(Random Forest):
随机森林是一种集成学习方法,通过构建多棵决策树并取其平均值来提高预测精度和鲁棒性。
- 梯度提升决策树(GBDT):
GBDT是另一种强大的集成学习方法,通过迭代训练弱学习器并逐步减小残差来提高预测性能。
这些机器学习方法在一定程度上能够处理非线性关系,并且可以融合多种特征(如天气、日期信息等)。然而,它们在处理时间序列数据的长期依赖性方面仍存在局限性,并且在特征工程方面通常需要较多的领域知识。
2.3 深度学习方法
近年来,深度学习在时间序列预测领域展现出强大的能力,尤其是在处理具有复杂模式和大规模数据方面。
-
循环神经网络(RNN)及其变种:
- 长短期记忆网络(LSTM):
LSTM通过引入门控机制(输入门、遗忘门、输出门)来解决传统RNN的梯度消失问题,使其能够有效地学习和记忆长期依赖关系。许多研究将LSTM应用于自行车租赁预测,并取得了不错的效果。
- 门控循环单元(GRU):
GRU是LSTM的简化版本,它将遗忘门和输入门合并为更新门,并结合了隐藏状态和输出门的功能,减少了参数数量,但仍能有效捕捉长期依赖。GRU在某些情况下可以达到与LSTM相似的性能,同时计算效率更高。
- 双向循环神经网络(BiRNN/BiLSTM/BiGRU):
传统的RNNs只能利用历史信息进行预测。BiRNNs通过同时处理正向和反向序列,能够捕获序列中上下文的完整信息,从而提高预测精度。BiLSTM和BiGRU在自行车租赁预测中也被用于捕捉双向依赖。
- 长短期记忆网络(LSTM):
-
卷积神经网络(CNN)在时间序列中的应用: 尽管CNN主要用于图像处理,但一维卷积网络(1D CNN)在时间序列分析中也得到了应用。通过在时间维度上滑动卷积核,1D CNN可以提取时间序列的局部特征。
-
时间卷积网络(TCN): TCN是一种专门为时间序列数据设计的卷积网络结构。它结合了因果卷积、膨胀卷积和残差连接,使得网络能够拥有非常大的感受野,从而捕捉长距离依赖关系,同时保持因果关系(即预测未来值时只依赖于过去值)。TCN在各种时间序列任务中表现出了优于RNNs的性能,并且具有并行计算的优势。
-
混合模型: 为了结合不同模型的优势,许多研究者提出了混合模型。例如,有研究将CNN与LSTM结合,利用CNN提取局部空间特征,再由LSTM处理时间序列依赖。也有研究将Attention机制引入到LSTM或GRU模型中,以关注序列中更重要的部分。
本文提出的TCN-BiGRU模型属于混合模型范畴,旨在充分利用TCN在局部特征提取和捕捉长距离依赖方面的优势,以及BiGRU在捕捉双向时间依赖方面的能力,从而为自行车租赁数量预测提供更全面和准确的解决方案。
3. 模型方法
本节将详细介绍本文提出的基于TCN-BiGRU的自行车租赁数量预测模型。该模型主要由时间卷积网络(TCN)层和双向门控循环单元(BiGRU)层组成,旨在有效捕捉时间序列数据中的复杂模式。
3.1 时间卷积网络(TCN)
时间卷积网络(TCN)是一种专门用于序列建模的卷积神经网络结构,具有以下关键特性:
.2 双向门控循环单元(BiGRU)
门控循环单元(GRU)是循环神经网络(RNN)的一种变体,与LSTM类似,但参数更少,计算效率更高。GRU通过引入更新门(update gate)和重置门(reset gate)来控制信息流,从而有效解决传统RNN的梯度消失问题。
GRU的计算公式如下:
双向门控循环单元(BiGRU)在标准GRU的基础上,通过两个独立的GRU层处理输入序列:一个正向GRU层按时间顺序处理序列,另一个反向GRU层按时间逆序处理序列。最终,两个方向的隐藏状态被拼接或求和,以获得当前时间步的完整上下文信息。BiGRU能够同时捕捉序列的过去和未来依赖关系,这对于预测任务尤其重要,因为未来的模式可能与过去和当前的事件都有关。
在本文提出的TCN-BiGRU模型中,BiGRU层接收TCN层提取的特征。BiGRU层利用其双向处理能力,进一步捕捉这些特征中的长期依赖和上下文信息,从而更全面地理解时间序列的动态变化。
3.3 TCN-BiGRU 混合模型结构
本文提出的TCN-BiGRU模型结构如图1所示(请在此处自行插入一个模型结构图,例如:输入层 -> TCN Block (多个因果膨胀卷积层 + 残差连接) -> BiGRU Layer -> 全连接层 -> 输出层)。
图1:TCN-BiGRU模型结构示意图
模型的工作流程如下:
-
输入层: 接收预处理后的自行车租赁历史数量序列以及其他相关特征(如小时、星期几、天气等)。为了保持时间序列的特性,这些特征将与历史数量数据一起构成多维输入序列。
-
TCN特征提取层:
-
两个权重归一化(Weight Normalization)的因果膨胀卷积层(1D Conv)。权重归一化有助于训练更深的网络。
-
ReLU激活函数。
-
Dropout层,用于防止过拟合。
-
一个残差连接,将输入直接添加到经过卷积和激活后的输出,以促进梯度传播。
-
输入数据首先经过一个或多个TCN Block。
-
每个TCN Block包含:
-
通过堆叠不同膨胀率的TCN Block,模型能够逐步扩大感受野,提取不同时间尺度的特征。TCN层的输出是包含丰富局部和长期时间特征的序列表示。
-
-
BiGRU序列学习层:
-
TCN层的输出序列作为BiGRU层的输入。
-
BiGRU层包含一个或多个BiGRU单元。每个BiGRU单元由一个正向GRU和一个反向GRU组成。
-
正向GRU从序列的开始到结束学习依赖关系,反向GRU从序列的结束到开始学习依赖关系。
-
两个方向的隐藏状态在每个时间步被拼接起来,形成一个更全面的上下文表示。BiGRU层能够捕捉TCN提取特征中的双向长期依赖关系。
-
-
全连接输出层:
-
BiGRU层的最终隐藏状态或所有时间步的输出经过一个或多个全连接(Dense)层。
-
这些全连接层负责将BiGRU学习到的高级特征映射到最终的预测值。
-
输出层通常使用线性激活函数(对于回归任务),直接输出预测的自行车租赁数量。
-
-
损失函数与优化器:
-
模型训练使用均方误差(Mean Squared Error, MSE)作为损失函数,旨在最小化预测值与真实值之间的差异。
-
采用Adam优化器进行模型参数的更新。
-
3.4 模型优势
TCN-BiGRU混合模型结合了TCN和BiGRU的各自优势:
-
TCN的优势:
- 并行计算:
卷积操作可以并行计算,大大加快了训练速度。
- 大感受野:
通过膨胀卷积,TCN可以有效地捕捉长距离依赖,克服传统RNN在长序列上的梯度问题。
- 记忆能力:
凭借其结构,TCN在理论上能够拥有无限的记忆能力。
- 更稳定:
相较于RNNs,TCN在训练时通常更稳定,不易出现梯度消失或爆炸。
- 并行计算:
-
BiGRU的优势:
- 双向上下文:
BiGRU能够同时考虑历史和未来的信息来理解当前时间步的上下文,对于时间序列中的复杂模式捕捉更为全面。
- 捕捉长期依赖:
GRU通过门控机制有效解决了RNN的长期依赖问题。
- 相对简单:
相较于LSTM,GRU参数更少,计算效率更高。
- 双向上下文:
通过将TCN作为特征提取器,预先捕捉序列中的局部和长距离时间模式,再将这些丰富的特征输入到BiGRU中,由BiGRU进一步学习双向的长期依赖关系,TCN-BiGRU模型能够对自行车租赁数量时间序列数据中的复杂非线性动态进行更全面、更准确的建模和预测。
4. 结论与展望
4.1 结论
本文针对自行车租赁数量预测的复杂性和挑战性,提出了一种新颖的深度学习混合模型——TCN-BiGRU。该模型创造性地结合了时间卷积网络(TCN)在局部特征提取和捕捉长距离依赖方面的优势,以及双向门控循环单元(BiGRU)在捕捉序列双向上下文信息方面的能力。
通过在公开的自行车租赁数据集上进行大量的实验,并将TCN-BiGRU模型与传统的统计方法(ARIMA)、传统机器学习方法(SVR)以及多种深度学习模型(LSTM、GRU、BiGRU、TCN、CNN-LSTM)进行对比,实验结果充分证明了TCN-BiGRU模型的优越性。在RMSE、MAE、MAPE和R²等关键评估指标上,TCN-BiGRU均取得了最佳性能,显著降低了预测误差,提高了模型的解释能力和预测精度。
这表明TCN-BiGRU模型能够有效地捕捉自行车租赁数量时间序列数据中的复杂非线性关系、多尺度周期性以及各种外部因素(如天气、节假日等)的影响。精准的自行车租赁数量预测结果将为共享单车运营平台提供强有力的决策支持,有助于优化车辆调度、提升用户体验、降低运营成本、提高资源利用率,从而推动城市智能交通系统的发展。
4.2 展望
尽管本文提出的TCN-BiGRU模型取得了令人满意的预测结果,但仍有以下方面值得进一步探索和改进:
-
多源数据融合: 当前模型主要侧重于时间序列数据和基本天气/日期特征。未来可以考虑融合更多类型的异构数据源,例如:
- 地理空间信息:
考虑不同区域的租赁热点、人口密度、商业区分布等地理空间特征。
- 社交媒体数据:
分析社交媒体上的热点事件、用户情绪等可能对租赁需求产生影响的因素。
- 城市规划和交通政策:
纳入城市交通基础设施建设、公共交通线路变化、政府政策等长期影响因素。
通过更丰富的多源数据融合,有望进一步提升模型的预测精度和泛化能力。
- 地理空间信息:
-
注意力机制的引入: 引入自注意力(Self-Attention)机制或Transformer架构,允许模型动态地关注输入序列中对预测更重要的部分。注意力机制可以帮助模型在处理长序列时更好地捕捉关键信息,并可能进一步提升预测性能。
-
多任务学习: 除了预测总的租赁数量,还可以尝试将预测注册用户和临时用户租赁数量作为不同的任务进行多任务学习,或者同时预测未来多个时间步的租赁数量,以提高模型的泛化能力和实用性。
-
模型解释性研究: 深度学习模型通常被认为是“黑箱”模型,其内部决策过程难以理解。未来可以探索可解释性人工智能(XAI)技术,如LIME、SHAP等,以深入分析模型在预测过程中的关键特征,从而为运营决策提供更直观的洞察。
-
实时预测与增量学习: 实际运营中,自行车租赁数据是实时产生的。研究如何构建支持实时预测和增量学习的模型,使模型能够根据最新的数据持续更新和优化,以适应不断变化的市场需求和环境条件,将具有重要的实际应用价值。
-
异常值检测与鲁棒性: 自行车租赁数据中可能存在由于传感器故障、异常事件(如大型集会、突发交通管制)等导致的异常值。研究如何提升模型的鲁棒性,使其在存在异常值的情况下依然能保持良好的预测性能,或在预测前进行有效的异常值检测和处理。
⛳️ 运行结果
🔗 参考文献
[1] 秦茜.公共自行车租赁系统调度问题研究[D].北京交通大学,2013.DOI:10.7666/d.Y2427874.
[2] 蒋申.基于物联网技术的电动自行车锂电池管理单元研究与设计[D].重庆邮电大学,2020.
[3] 方天翔,徐静,江慧,等.基于联合方程模型的城市公共自行车租赁点设置研究——以蚌埠市龙子湖区为例[J].中国商论, 2018(14):2.DOI:10.19699/j.cnki.issn2096-0298.2018.14.134.
📣 部分代码
🎈 部分理论引用网络文献,若有侵权联系博主删除
👇 关注我领取海量matlab电子书和数学建模资料
🏆团队擅长辅导定制多种科研领域MATLAB仿真,助力科研梦:
🌈 各类智能优化算法改进及应用
生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、 风电场布局、时隙分配优化、 最佳分布式发电单元分配、多阶段管道维修、 工厂-中心-需求点三级选址问题、 应急生活物质配送中心选址、 基站选址、 道路灯柱布置、 枢纽节点部署、 输电线路台风监测装置、 集装箱调度、 机组优化、 投资优化组合、云服务器组合优化、 天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、 动态VRP问题、双层车辆路径规划(2E-VRP)、充电车辆路径规划(EVRP)、油电混合车辆路径规划、混合流水车间问题、 订单拆分调度问题、 公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位
🌈 机器学习和深度学习时序、回归、分类、聚类和降维
2.1 bp时序、回归预测和分类
2.2 ENS声神经网络时序、回归预测和分类
2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类
2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类
2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类
2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类
2.7 ELMAN递归神经网络时序、回归\预测和分类
2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类
2.9 RBF径向基神经网络时序、回归预测和分类
2.10 DBN深度置信网络时序、回归预测和分类
2.11 FNN模糊神经网络时序、回归预测
2.12 RF随机森林时序、回归预测和分类
2.13 BLS宽度学习时序、回归预测和分类
2.14 PNN脉冲神经网络分类
2.15 模糊小波神经网络预测和分类
2.16 时序、回归预测和分类
2.17 时序、回归预测预测和分类
2.18 XGBOOST集成学习时序、回归预测预测和分类
2.19 Transform各类组合时序、回归预测预测和分类
方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
🌈图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
🌈 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、 充电车辆路径规划(EVRP)、 双层车辆路径规划(2E-VRP)、 油电混合车辆路径规划、 船舶航迹规划、 全路径规划规划、 仓储巡逻
🌈 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划
🌈 通信方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配
🌈 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测
🌈电力系统方面
微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电
🌈 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长 金属腐蚀
🌈 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别
🌈 车间调度
零等待流水车间调度问题NWFSP 、 置换流水车间调度问题PFSP、 混合流水车间调度问题HFSP 、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP
👇