✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。
🍎 往期回顾关注个人主页:Matlab科研工作室
🍊个人信条:格物致知,完整Matlab代码及仿真咨询内容私信。
🔥 内容介绍
一、研究背景与意义
随着 5G/6G 通信技术、物联网(IoT)及智能装备的快速发展,用户对通信网络的覆盖范围、连接质量及灵活性提出了更高要求。传统地面通信基站受限于固定部署模式,在应急救援、偏远地区通信、大型集会临时通信等场景下,存在覆盖盲区多、部署周期长、成本高等问题。无人机(Unmanned Aerial Vehicle, UAV)凭借其机动性强、部署灵活、覆盖范围广等优势,成为构建临时通信网络的理想载体,可作为空中通信基站(UAV-BS)为地面用户提供通信服务,有效弥补地面通信网络的不足。
在基于无人机的通信网络中,分布式用户连接最大化是核心优化目标之一,即通过合理规划多架无人机的飞行轨迹、悬停位置及资源分配策略,使网络中能够稳定连接的地面用户数量最多,同时满足用户的通信质量要求(如信号强度、时延、误码率等)。然而,该问题面临诸多挑战:一是地面用户分布具有随机性和动态性,用户可能随时间移动或增减;二是无人机的飞行存在能量约束(续航时间有限)和运动约束(最大飞行速度、高度限制);三是多无人机之间存在通信干扰,若位置规划不合理,会导致用户信号受扰,连接稳定性下降;四是网络状态(如用户位置、信道质量)具有不确定性,需算法具备实时决策与自适应调整能力。
传统优化方法(如整数规划、贪心算法)虽能在静态场景下求解简单问题,但面对动态、不确定的多无人机通信网络,存在计算复杂度高、实时性差、鲁棒性不足等问题。深度强化学习(Deep Reinforcement Learning, DRL)通过深度神经网络(Deep Neural Network, DNN)拟合价值函数或策略函数,能够在复杂环境中实现端到端的决策优化,为解决该问题提供了新思路。其中,深度 Q 学习(Deep Q-Network, DQN)通过经验回放和目标网络机制,有效解决了传统 Q 学习在高维状态空间中的不稳定性问题;多智能体深度 Q 学习(Multi-Agent Deep Q-Learning, MA-DQL)则将 DQN 扩展至多智能体场景,使多架无人机能够在分布式决策框架下协同优化,无需集中式控制中心,提升了网络的灵活性和容错性。
PyTorch 作为一款开源深度学习框架,具有动态计算图、易用性强、生态丰富等优势,能够高效实现 DQN 与 MA-DQL 算法的建模、训练与部署,为算法在无人机通信网络中的应用提供技术支撑。因此,本研究基于 DQN 和 PyTorch 构建 MA-DQL 算法,用于求解无人机通信网络中的分布式用户连接最大化问题,对提升无人机通信网络的服务能力、拓展其实际应用场景具有重要的理论意义和工程价值。
二、问题模型建立









四、总结与展望
(一)研究总结
本研究针对基于无人机的通信网络中分布式用户连接最大化问题,基于 DQN 和 PyTorch 构建了 MA-DQL 算法,主要工作与结论如下:
- 问题建模:建立了包含无人机运动约束、能量约束、用户通信质量约束的系统模型,定义了多智能体的状态空间、动作空间与奖励函数,将用户连接最大化问题转化为 MDP 问题;
- 算法设计:基于 PyTorch 实现了 MA-DQL 算法,采用分布式决策框架,结合经验回放、目标网络机制提升训练稳定性,引入区域划分、全局信息局部化等策略增强多无人机协同能力;
- 仿真验证:在不同用户规模、动态场景下的仿真实验表明,MA-DQL 算法的用户连接数、覆盖率、收敛速度及能量利用率均优于 Greedy、Single-Agent DQN 等对比算法,能有效适应动态、不确定的通信环境;
- 敏感性分析:无人机数量对算法性能有显著影响,需根据用户数量合理配置无人机规模,平衡覆盖效果与能量效率。
(二)研究展望
尽管本研究取得了一定成果,但仍有以下方向可进一步拓展:
- 连续动作空间优化:当前 MA-DQL 采用动作离散化方案,未来可结合 DDPG、TD3(Twin Delayed DDPG)等算法,直接处理连续动作(如无人机的连续位移、发射功率调整),提升决策精度;
- 异构无人机网络:当前假设所有无人机性能一致,未来可考虑异构无人机(如不同续航、不同覆盖范围),设计差异化的 Q 网络与奖励函数,提升网络整体性能;
- 通信干扰建模优化:当前干扰模型简化为距离约束,未来可引入更真实的信道干扰模型(如多径衰落、同频干扰),使算法更贴近实际通信场景;
- 边缘部署与实时性优化:当前算法基于 GPU 训练,未来可通过模型压缩(如量化、剪枝)、边缘计算技术,将训练好的 Q 网络部署到无人机嵌入式平台,实现实时决策;
- 多目标优化扩展:当前以用户连接最大化为单一目标,未来可引入多目标优化(如用户连接最大化、能耗最小化、时延最小化),采用多目标 MA-DQL 算法生成 Pareto 最优解集,为不同场景提供灵活选择。
⛳️ 运行结果

🔗 参考文献
[1] 甘良棋,董超.基于多智能体协同的无人机编队控制研究[J].计算机科学, 2024, 51(11A):240100105-7.DOI:10.11896/jsjkx.240100105.
[2] 冯欧阳,马奇,移强平,等.基于改进蚁群算法的无人机在配电网线路巡检中的研究与应用[J].电气时代, 2024(7):49-53.
[3] 赵茁乔.基于知识图谱的6G网络场景认知方法研究[D].西安电子科技大学,2023.
📣 部分代码
🎈 部分理论引用网络文献,若有侵权联系博主删除
👇 关注我领取海量matlab电子书和数学建模资料
🏆团队擅长辅导定制多种科研领域MATLAB仿真,助力科研梦:
🌈 各类智能优化算法改进及应用
生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、 风电场布局、时隙分配优化、 最佳分布式发电单元分配、多阶段管道维修、 工厂-中心-需求点三级选址问题、 应急生活物质配送中心选址、 基站选址、 道路灯柱布置、 枢纽节点部署、 输电线路台风监测装置、 集装箱调度、 机组优化、 投资优化组合、云服务器组合优化、 天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、 动态VRP问题、双层车辆路径规划(2E-VRP)、充电车辆路径规划(EVRP)、油电混合车辆路径规划、混合流水车间问题、 订单拆分调度问题、 公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位
🌈 机器学习和深度学习时序、回归、分类、聚类和降维
2.1 bp时序、回归预测和分类
2.2 ENS声神经网络时序、回归预测和分类
2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类
2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类
2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类
2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类
2.7 ELMAN递归神经网络时序、回归\预测和分类
2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类
2.9 RBF径向基神经网络时序、回归预测和分类
2.10 DBN深度置信网络时序、回归预测和分类
2.11 FNN模糊神经网络时序、回归预测
2.12 RF随机森林时序、回归预测和分类
2.13 BLS宽度学习时序、回归预测和分类
2.14 PNN脉冲神经网络分类
2.15 模糊小波神经网络预测和分类
2.16 时序、回归预测和分类
2.17 时序、回归预测预测和分类
2.18 XGBOOST集成学习时序、回归预测预测和分类
2.19 Transform各类组合时序、回归预测预测和分类
方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
🌈图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
🌈 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、 充电车辆路径规划(EVRP)、 双层车辆路径规划(2E-VRP)、 油电混合车辆路径规划、 船舶航迹规划、 全路径规划规划、 仓储巡逻
🌈 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划
🌈 通信方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配
🌈 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测
🌈电力系统方面
微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电
🌈 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长 金属腐蚀
🌈 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别
🌈 车间调度
零等待流水车间调度问题NWFSP 、 置换流水车间调度问题PFSP、 混合流水车间调度问题HFSP 、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP
👇
742

被折叠的 条评论
为什么被折叠?



