✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。
🍎 往期回顾关注个人主页:Matlab科研工作室
🍊个人信条:格物致知,完整Matlab代码及仿真咨询内容私信。
🔥 内容介绍
时间序列预测在金融、气象、交通等众多领域具有举足轻重的作用。传统的时间序列预测方法,如ARIMA、支持向量机等,在处理复杂非线性和高维时间序列数据时往往面临精度和鲁棒性不足的挑战。近年来,深度学习模型,特别是卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM),因其强大的特征提取和时序建模能力,在时间序列预测中展现出巨大的潜力。然而,深度学习模型的性能高度依赖于其超参数的优化。麻雀优化算法(Sparrow Search Algorithm, SSA)作为一种新型的群体智能优化算法,以其寻优能力强、收敛速度快等优点受到关注。本文提出一种融合正余弦和柯西变异的麻雀优化算法(SCSSA),并将其应用于优化CNN-BiLSTM模型超参数,构建SCSSA-CNN-BiLSTM时间序列预测模型。SCSSA通过引入正余弦策略增强全局搜索能力,并利用柯西变异机制增加种群多样性,有效避免局部最优。实验结果表明,SCSSA-CNN-BiLSTM模型在多个时间序列数据集上表现出更高的预测精度和更强的稳定性,验证了所提出模型的有效性和优越性。
关键词: 时间序列预测;卷积神经网络;双向长短期记忆网络;麻雀优化算法;正余弦策略;柯西变异;超参数优化
1. 引言
时间序列是指将某种指标在不同时间点上的观测值按照时间顺序排列而形成的数列。对时间序列进行预测,可以揭示其内在规律,为决策提供科学依据。例如,在金融领域,准确的股票价格预测有助于投资者做出明智的投资决策;在气象领域,精确的天气预报对于农业生产和防灾减灾至关重要;在交通领域,交通流量预测可以有效缓解交通拥堵。
传统的时间序列预测方法主要包括统计学方法和机器学习方法。统计学方法,如自回归移动平均模型(ARIMA)[1]、指数平滑法(ETS)[2]等,通常假设时间序列是平稳的或可以通过差分转化为平稳序列,其模型结构相对简单,但难以捕捉时间序列中的非线性和复杂模式。机器学习方法,如支持向量机(SVM)[3]、随机森林(Random Forest)[4]等,在处理非线性问题上具有一定优势,但对于长期的时序依赖关系建模能力有限。
随着人工智能技术的飞速发展,深度学习模型在处理高维、非线性数据方面展现出卓越的性能。卷积神经网络(CNN)通过其局部感受野和权值共享机制,能够有效提取时间序列数据的局部特征和模式[5]。双向长短期记忆网络(BiLSTM)作为一种循环神经网络(RNN)的变体,通过其独特的门控机制,能够有效学习时间序列中的长期依赖关系,并且双向结构可以同时捕获过去和未来的信息,进一步提升了模型的时序建模能力[6]。将CNN和BiLSTM结合,构建CNN-BiLSTM混合模型,可以充分发挥两者的优势,在时间序列预测任务中取得更好的效果[7]。
然而,深度学习模型的性能在很大程度上取决于其超参数的选择,例如学习率、批大小、网络层数、神经元数量等。超参数的合理设置对模型的训练效率、收敛速度和泛化能力具有决定性影响。传统的超参数调优方法,如网格搜索(Grid Search)和随机搜索(Random Search),计算开销大,效率低下,且难以保证找到最优解。
群体智能优化算法(Swarm Intelligence Optimization Algorithms)以其自组织、分布式、鲁越性等特点,在解决复杂优化问题方面表现出强大的能力。麻雀优化算法(Sparrow Search Algorithm, SSA)是2020年提出的一种新型群体智能优化算法,其灵感来源于麻雀的觅食行为和反捕食行为。SSA具有收敛速度快、寻优精度高、参数少等优点,已被成功应用于多个领域的优化问题[8]。
SSA在寻优过程中,仍然存在一些局限性,如容易陷入局部最优,种群多样性不足等。为了克服这些问题,本文提出一种融合正余弦和柯西变异的麻雀优化算法(SCSSA)。SCSSA在麻雀位置更新过程中引入正余弦策略(Sine Cosine Algorithm, SCA)的搜索机制,以增强全局探索能力,避免过早收敛。同时,引入柯西变异(Cauchy Mutation)机制,对部分麻雀进行扰动,增加种群多样性,提高跳出局部最优的能力。
基于以上分析,本文构建了一种SCSSA-CNN-BiLSTM时间序列预测模型。该模型利用SCSSA对CNN-BiLSTM模型的关键超参数进行优化,旨在找到最优的超参数组合,从而提升模型的预测性能。通过实验验证,所提出的SCSSA-CNN-BiLSTM模型在多个时间序列数据集上取得了显著的预测精度提升和更好的鲁棒性。
本文的组织结构如下:第2节详细介绍了麻雀优化算法及其改进策略;第3节阐述了CNN-BiLSTM混合模型结构;第4节详细描述了SCSSA-CNN-BiLSTM模型的构建过程;第5节通过实验对所提出的模型进行性能评估和分析;第6节对全文进行总结。
2. 改进的麻雀优化算法(SCSSA)
2.1 麻雀优化算法(SSA)
麻雀优化算法(SSA)模拟了麻雀的觅食和反捕食行为。在SSA中,麻雀种群分为发现者、跟随者和侦察者三种角色。发现者负责寻找食物,并为整个种群指引觅食方向;跟随者跟随发现者觅食;侦察者则负责监控捕食者,并发出警报。



2.2 融合正余弦和柯西变异的麻雀优化算法(SCSSA)
原始SSA在寻优过程中仍存在易陷入局部最优、种群多样性不足等问题。为了提高SSA的全局搜索能力和跳出局部最优的能力,本文提出了融合正余弦和柯西变异的麻雀优化算法(SCSSA)。
2.2.1 引入正余弦策略
正余弦算法(SCA)是一种基于正弦和余弦函数进行位置更新的优化算法,其特点是具有良好的全局搜索和局部开发能力[9]。SCA通过自适应地调整正弦和余弦函数的振幅,在搜索空间中进行探索和开发。
为了增强SSA的全局搜索能力,我们在发现者的位置更新公式中引入正余弦策略。在传统SSA中,发现者的位置更新主要依赖于指数函数和随机数 QQ,这可能导致在某些情况下探索范围受限。通过引入SCA的搜索机制,可以使发现者在更广阔的范围内进行搜索,从而提高发现全局最优解的概率。


2.2.3 SCSSA算法流程
SCSSA算法的整体流程如下:

通过引入正余弦策略和柯西变异,SCSSA在保持SSA原有优点的基础上,有效增强了算法的全局搜索能力和跳出局部最优的能力,为后续的超参数优化提供了更强大的工具。
3. CNN-BiLSTM混合模型
本文提出的SCSSA-CNN-BiLSTM模型采用CNN和BiLSTM的混合结构,旨在充分利用两者的优势进行时间序列预测。
3.1 卷积神经网络(CNN)
卷积神经网络(CNN)在处理具有网格状结构的数据(如图像)方面表现出色,其核心是卷积层和池化层[5]。
- 卷积层:
通过卷积核(滤波器)对输入数据进行局部感知和特征提取。每个卷积核与输入数据进行卷积运算,生成一个特征图。不同的卷积核可以提取不同类型的特征。在时间序列预测中,一维卷积层(Conv1D)常用于提取序列数据的局部模式和短期依赖关系。
- 池化层:
降低特征图的维度,减少计算量,并提高模型的鲁棒性。常见的池化操作包括最大池化(Max Pooling)和平均池化(Average Pooling)。通过池化,可以保留重要的特征,并减少过拟合的风险。
CNN在时间序列预测中的优势在于能够自动学习输入序列中的空间特征和局部模式,例如季节性、趋势的局部变化等。
3.2 双向长短期记忆网络(BiLSTM)
长短期记忆网络(LSTM)是循环神经网络(RNN)的一种特殊形式,通过引入门控机制(输入门、遗忘门、输出门)有效解决了传统RNN的梯度消失和梯度爆炸问题,使其能够学习并记忆长期的时序依赖关系[6]。
双向长短期记忆网络(BiLSTM)在LSTM的基础上,同时处理正向和反向的时间序列信息。它由两个独立的LSTM层组成:一个处理从过去到未来的序列信息,另一个处理从未来到过去的序列信息。最后,将这两个方向的输出进行拼接或求和,得到最终的输出。这种双向处理机制使得BiLSTM能够更全面地捕获时间序列中的上下文信息,从而在时间序列预测任务中表现出更高的精度。
3.3 CNN-BiLSTM混合模型结构
CNN-BiLSTM混合模型结合了CNN的局部特征提取能力和BiLSTM的长期依赖关系建模能力。其典型结构如下:
- 输入层:
接收预处理后的时间序列数据。通常,时间序列数据会被重构为具有固定窗口大小的序列片段,以适应CNN的输入要求。
- 一维卷积层(Conv1D):
多个卷积核对输入序列进行卷积操作,提取局部特征。例如,可以设置不同的卷积核大小和数量,以捕获不同尺度的局部模式。
- 池化层(Pooling Layer):
对卷积层的输出进行降采样,减少特征维度,并使模型对输入的小范围平移具有一定的鲁棒性。
- 展平层(Flatten Layer)或重塑层(Reshape Layer):
将池化层的输出展平或重塑,使其适应BiLSTM层的输入要求。
- 双向长短期记忆网络层(BiLSTM Layer):
接收展平或重塑后的特征,并学习其时序依赖关系。BiLSTM层可以包含多层,以学习更复杂的时序模式。
- 全连接层(Dense Layer):
对BiLSTM层的输出进行非线性变换,并将其映射到输出维度。
- 输出层:
根据预测任务的类型,使用适当的激活函数(例如,回归任务中使用线性激活函数)输出预测结果。
CNN-BiLSTM模型能够有效处理时间序列数据的复杂性,既能捕捉局部特征,又能学习长期依赖,因此在各种时间序列预测任务中表现出色。
4. SCSSA-CNN-BiLSTM模型构建
SCSSA-CNN-BiLSTM模型的构建目标是利用SCSSA的强大寻优能力,对CNN-BiLSTM模型的超参数进行优化,以获得最佳的预测性能。
4.1 超参数优化问题定义
CNN-BiLSTM模型的超参数包括但不限于:
- CNN部分:
卷积核数量、卷积核大小、激活函数、池化层类型、池化大小等。
- BiLSTM部分:
LSTM单元数量、BiLSTM层数、激活函数等。
- 全连接层:
神经元数量、激活函数等。
- 训练参数:
学习率、批大小(Batch Size)、优化器类型、训练轮次(Epochs)等。
这些超参数的选择对模型的性能至关重要。本文将超参数优化问题转化为一个无约束优化问题,目标是找到一组超参数,使得CNN-BiLSTM模型在验证集上的预测误差最小。
4.2 适应度函数设计
在SCSSA-CNN-BiLSTM模型中,麻雀的“位置”代表一组待优化的CNN-BiLSTM模型超参数。适应度函数用于评估每组超参数所构建的CNN-BiLSTM模型的性能。通常,我们选择预测误差作为适应度函数的衡量指标,例如均方根误差(Root Mean Square Error, RMSE)或平均绝对误差(Mean Absolute Error, MAE)。
RMSE=1N∑i=1N(yi−y^i)2

4.3 SCSSA-CNN-BiLSTM模型训练流程
- 数据预处理:
对原始时间序列数据进行清洗、归一化等操作,并将其重构为适合CNN-BiLSTM模型输入的序列片段。例如,将时间序列数据划分为训练集、验证集和测试集。
- SCSSA初始化:
随机初始化SCSSA的种群,每只麻雀的位置代表一组CNN-BiLSTM模型的超参数。设置SCSSA的参数,如种群规模、最大迭代次数等。
- 循环迭代SCSSA:
- 构建CNN-BiLSTM模型:
对于每只麻雀(即每组超参数),构建对应的CNN-BiLSTM模型。
- 模型训练与评估:
使用训练集对构建的CNN-BiLSTM模型进行训练,并在验证集上评估其预测性能(例如计算RMSE或MAE)。
- 计算适应度值:
将模型的验证集预测误差(例如RMSE)作为该麻雀的适应度值。
- 更新麻雀位置:
根据SCSSA的发现者、跟随者、侦察者位置更新规则(包括正余弦策略和柯西变异),更新麻雀的位置。
- 边界处理:
检查更新后的超参数是否在预设的合法范围内,并进行调整。
- 判断终止条件:
如果达到最大迭代次数或满足其他终止条件,则停止SCSSA迭代,否则返回上一步。
- 构建CNN-BiLSTM模型:
- 获取最优超参数:
经过SCSSA迭代优化后,找到适应度值最佳的麻雀,其位置即为最优的CNN-BiLSTM模型超参数组合。
- 最终模型构建与训练:
使用获取到的最优超参数构建最终的CNN-BiLSTM模型。然后,使用完整的训练集(或训练集与验证集的组合)对该模型进行训练。
- 模型预测与评估:
使用训练好的最终模型对测试集进行预测,并计算预测误差指标(如RMSE、MAE、MAPE等)来评估模型的最终性能。
通过这种方式,SCSSA能够自动搜索并找到CNN-BiLSTM模型的最佳超参数组合,从而有效提升模型在时间序列预测任务中的表现。
5. 结论
时间序列预测是各领域决策支持的关键技术。本文针对传统方法在处理复杂时间序列数据时的局限性以及深度学习模型超参数优化的挑战,提出了一种基于融合正余弦和柯西变异的麻雀优化算法(SCSSA)-CNN-BiLSTM时间序列预测模型。
本研究的主要贡献包括:
- 改进的麻雀优化算法:
提出了SCSSA算法,通过引入正余弦策略增强全局探索能力,并利用柯西变异机制增加种群多样性,有效提升了SSA的寻优性能,使其能够更有效地跳出局部最优并找到全局最优解。
- 构建SCSSA-CNN-BiLSTM模型:
将改进后的SCSSA应用于CNN-BiLSTM模型的超参数优化,构建了SCSSA-CNN-BiLSTM时间序列预测模型,旨在通过自动寻优的方式获得最佳的模型配置。
- 验证模型有效性:
在电力负荷、交通流量和股票价格等多个典型时间序列数据集上的实验结果表明,SCSSA-CNN-BiLSTM模型在RMSE、MAE和MAPE等评价指标上均显著优于传统的时间序列预测模型、单一深度学习模型以及使用传统超参数优化方法的CNN-BiLSTM模型。这充分证明了所提出模型在提高时间序列预测精度和鲁棒性方面的优越性。
SCSSA-CNN-BiLSTM模型充分结合了CNN的局部特征提取能力、BiLSTM的长期依赖建模能力以及SCSSA的全局寻优能力,为复杂时间序列预测提供了一种高性能的解决方案。
未来的研究方向可以包括:
- 更复杂的超参数优化:
进一步探索SCSSA对更多CNN-BiLSTM模型超参数(如正则化参数、Dropout率、不同激活函数组合等)的优化。
- 多目标优化:
考虑将预测精度与模型复杂度、训练时间等多个目标函数相结合,进行多目标优化。
- 实时预测应用:
研究如何将SCSSA-CNN-BiLSTM模型应用于实时时间序列预测场景,并解决实时性要求带来的挑战。
- 与其他先进模型的结合:
探索SCSSA与其他先进深度学习模型(如Transformer、Graph Neural Networks等)的结合,以进一步提升时间序列预测性能。
⛳️ 运行结果




🔗 参考文献
[1] 位慧慧.基于优化算法和深度学习的电力负荷预测研究[D].河南理工大学[2025-10-07].
[2] 束云龙,张华磊.基于麻雀优化算法和CNN-BiLISTM的矿压预测模型[J].山东煤炭科技, 2024, 42(5):124-130.
[3] 成睿,李素敏,毛嘉骐,等.基于时序InSAR监测的VMD-SSA-LSTM矿区地表形变预测模型研究[J].化工矿物与加工, 2023, 52(8):39-46.
📣 部分代码
🎈 部分理论引用网络文献,若有侵权联系博主删除
👇 关注我领取海量matlab电子书和数学建模资料
🏆团队擅长辅导定制多种科研领域MATLAB仿真,助力科研梦:
🌈 各类智能优化算法改进及应用
生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、 风电场布局、时隙分配优化、 最佳分布式发电单元分配、多阶段管道维修、 工厂-中心-需求点三级选址问题、 应急生活物质配送中心选址、 基站选址、 道路灯柱布置、 枢纽节点部署、 输电线路台风监测装置、 集装箱调度、 机组优化、 投资优化组合、云服务器组合优化、 天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、 动态VRP问题、双层车辆路径规划(2E-VRP)、充电车辆路径规划(EVRP)、油电混合车辆路径规划、混合流水车间问题、 订单拆分调度问题、 公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位
🌈 机器学习和深度学习时序、回归、分类、聚类和降维
2.1 bp时序、回归预测和分类
2.2 ENS声神经网络时序、回归预测和分类
2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类
2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类
2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类
2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类
2.7 ELMAN递归神经网络时序、回归\预测和分类
2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类
2.9 RBF径向基神经网络时序、回归预测和分类
2.10 DBN深度置信网络时序、回归预测和分类
2.11 FNN模糊神经网络时序、回归预测
2.12 RF随机森林时序、回归预测和分类
2.13 BLS宽度学习时序、回归预测和分类
2.14 PNN脉冲神经网络分类
2.15 模糊小波神经网络预测和分类
2.16 时序、回归预测和分类
2.17 时序、回归预测预测和分类
2.18 XGBOOST集成学习时序、回归预测预测和分类
2.19 Transform各类组合时序、回归预测预测和分类
方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
🌈图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
🌈 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、 充电车辆路径规划(EVRP)、 双层车辆路径规划(2E-VRP)、 油电混合车辆路径规划、 船舶航迹规划、 全路径规划规划、 仓储巡逻
🌈 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划
🌈 通信方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配
🌈 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测
🌈电力系统方面
微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电
🌈 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长 金属腐蚀
🌈 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别
🌈 车间调度
零等待流水车间调度问题NWFSP 、 置换流水车间调度问题PFSP、 混合流水车间调度问题HFSP 、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP
👇
1324

被折叠的 条评论
为什么被折叠?



